MÓDULO 1.1

🎯 Demonstrativo vs Explicativo

A regra de ouro deste módulo: mostrar o app, não explicar o conceito. A skill video-demonstrativo navega uma aplicação web de verdade e a transforma num walkthrough narrado — diferente da irmã video-explicativo, que anima conceitos.

7
Tópicos
~30
Minutos
Básico
Nível
Teoria
Tipo
DUAS SKILLS IRMÃS 🖱️ DEMONSTRATIVO localhost:8000 tela real do app mostra app sendo usado 🎬 EXPLICATIVO motion graphics explica um conceito 🎯 Tem tela? → demonstrativo É conceito sem interface? → explicativo
1

🎬 O que é um walkthrough

Um walkthrough — ou vídeo de demonstração — percorre uma aplicação web real, tela por tela, mostrando o app em uso: abrir, clicar, preencher, gerar, ver o resultado. Nada é desenhado; tudo é capturado da tela de verdade.

Conceito Principal

O walkthrough responde "como eu uso isso?" mostrando a resposta na própria interface. Em vez de descrever botões e campos, ele aparece tocando neles — com um cursor que cai exatamente no controle e narração explicando cada passo.

Na prática: 5 a 8 passos + a CTA final dão um vídeo de cerca de 35 a 50 segundos. O arco típico é abrir o app → ação 1 → ação 2 → … → resultado → CTA.

Anatomia de um passo no roteiro (STEPS.md)
# cada passo = uma ação + uma frase de narração
Passo 1 (intro) — tela inicial do app
narração: "Este é o gerador de imagens do AutomationsAI."
Passo 2 — escrever o prompt
narração: "Escrevemos o que queremos gerar."
Passo 3 — clicar em Gerar
narração: "E clicamos em Gerar."
Passo final (zoom) — o resultado
narração: "Pronto: a imagem aparece em segundos."
💡
O primeiro passo apresenta, o último celebra

O passo de abertura costuma ser a tela inicial (marcada intro:true) para apresentar o app. O último passo de conteúdo costuma ser o resultado (zoom:true), com um zoom suave que valoriza a entrega.

Conceitos-chave
🖥️
App real
Tela de verdade
👣
Passo a passo
5–8 passos
🗣️
Narrado
1 frase/passo
⏱️
~35–50s
Duração típica
2

⚖️ Demonstrativo vs explicativo

São duas skills irmãs com o mesmo motor de render (HyperFrames) e a mesma CTA, mas propósitos opostos. Uma mostra um app real; a outra explica um conceito abstrato com cenas animadas.

As duas skills lado a lado
Aspecto 🖱️ video-demonstrativo 🎬 video-explicativo
ObjetivoMostrar um app sendo usadoExplicar um conceito
VisualScreenshots reaisMotion graphics animados
EntradaLink do app / localhostUm assunto / tema
Capturaagent-browser navega o appNão há captura
Formato16:9 (telas landscape)16:9 e 9:16
✓ É demonstrativo quando...
  • Existe um app/site com uma tela navegável
  • O usuário deu um link ou um localhost
  • Quer mostrar como uma feature funciona na prática
  • O foco é o produto, não a ideia por trás
🎬 É explicativo quando...
  • O tema é abstrato, sem interface para mostrar
  • Você quer ilustrar com diagramas e animações
  • Precisa de versão vertical (Shorts/Reels)
  • O foco é educar sobre um conceito
💡
Mesmo DNA, propósitos opostos

Ambas terminam na CTA do AutomationsAI e usam TTS local + HyperFrames. A diferença está na origem do visual: tela capturada (demonstrativo) versus cena desenhada (explicativo).

3

🤔 Quando usar cada um

Existe um teste de uma pergunta que decide a skill em segundos — e elimina a dúvida antes mesmo de começar o roteiro.

O teste de uma pergunta

"Existe uma tela para mostrar?"

Se a resposta é sim — há um app, um localhost, uma URL navegável —, é demonstrativo. Se não há interface, só uma ideia para ilustrar, é explicativo.

Árvore de decisão
1
O usuário deu um link ou localhost?

Se sim, é o sinal mais forte de demonstrativo. A própria entrada da skill é o link do app.

2
O pedido fala em "demo", "walkthrough", "mostrar como usar"?

Verbos de demonstração ("mostrar", "gravar a tela", "passo a passo usando") apontam para demonstrativo.

3
O pedido é "explique X", "vídeo sobre Y", sem app?

Aí é explicativo — o conteúdo será motion graphics, não captura de tela.

Na dúvida, pergunte: "tem um app no ar?"

Uma única pergunta ao usuário resolve casos ambíguos sem custo.

💡
App precisa estar no ar

Demonstrativo exige o app acessível durante a captura (ex.: localhost:8000 rodando). Sem o app no ar, não há o que navegar — confirme isso antes de prometer o vídeo.

4

📋 Casos de uso

O walkthrough brilha sempre que o objetivo é mostrar um produto em funcionamento. Quatro situações cobrem a maioria dos pedidos.

Quatro casos de uso clássicos
🚪
Onboarding de produto

Um novo usuário vê os primeiros passos do app: cadastro, tela principal, primeira ação de valor. Reduz o atrito de quem acabou de chegar.

Tutorial de feature

Demonstra uma funcionalidade específica de ponta a ponta — útil quando uma feature nova precisa de um "como funciona" rápido.

🚀
Lançamento

Vídeo de anúncio que mostra o produto real em ação no momento do lançamento, com a CTA do AutomationsAI no fim.

🛟
Suporte

Responde "como faço X?" com um vídeo curto mostrando o caminho exato na tela — anexável a um chamado ou base de ajuda.

📊 Validado em apps reais
App simples
Geração de imagem — fluxo de 7 passos, ~42s. O primeiro POC da skill.
App complexo
Suíte de dublagem com IA — tutorial de 14 passos, 2:08, com input controlado por React e fluxo assíncrono multi-estado.
💡
Quanto mais concreto o caso, melhor o roteiro

Saber se é onboarding, feature, lançamento ou suporte ajuda a escolher quais passos entram no vídeo — e qual é o "resultado" que merece o zoom final.

5

🖱️ O que a skill entrega

Quatro elementos transformam screenshots estáticos num vídeo que parece gravação de tela profissional: moldura de navegador, cursor animado, destaque/zoom e narração.

Conceito Principal

Os prints reais entram dentro de uma moldura de navegador (barra + URL) para parecer uma janela de verdade. Por cima, um cursor global animado mira a bounding box real de cada controle, clica com pulse + ripple, e o resultado ganha um zoom suave. A narração TTS amarra tudo.

Os quatro elementos
🪟
Moldura
Barra + URL
🖱️
Cursor
Mira a box real
🔍
Destaque/zoom
No resultado
🗣️
Narração
TTS PT-BR
✓ O que a skill faz
  • Cursor cai exato no controle (box real, não no olho)
  • Clique vira pulse + ripple visíveis
  • Zoom suave realça o resultado final
  • Timing sincroniza com os WAVs medidos por ffprobe
✗ O que a skill NÃO faz (limites honestos)
  • Estado dinâmico (vídeo, dados ao vivo) vira print estático
  • Não carrega o site ao vivo dentro do vídeo
  • App com login exige credenciais de teste
  • Movimento real só no modo v3 (roadmap, ainda não implementado)
6

📐 Formato de saída

A saída é um MP4 em 16:9, narrado em PT-BR e terminado na CTA do AutomationsAI. O formato landscape não é estético — é técnico: telas de app são largas.

A saída em números
16:9
Proporção
1920×1080
MP4
Container
via FFmpeg
30
FPS
render high
PT-BR
Narração
Kokoro local
A CTA final (padrão)

Toda saída termina na mesma cena: "CONTINUA EM" + AutomationsAI (AutomationsAI em creme, .CLUB em âmbar com glow) + 🌐 automationsai.net. A narração fecha com "Isso é conteúdo do AutomationsAI ponto CLUB. Acesse: inema ponto club." Já vem pronta no template de composição.

⚠️
9:16 não é o formato natural

Como telas de app são landscape, o template gera 16:9. Uma versão vertical exigiria recortar/reenquadrar a região ativa — está no roadmap, não no fluxo padrão. Não prometa Shorts de um walkthrough sem alinhar o reenquadre.

7

🔗 A entrada é o link

Diferente de skills que partem de um briefing ou roteiro, o ponto de partida do demonstrativo é literalmente o link do app — e ele precisa estar acessível.

O ponto de partida
# tudo começa com um link acessível
URL pública https://app.exemplo.com
Localhost http://localhost:8000/

# o agent-browser abre num viewport fixo
agent-browser set viewport 1280 800
agent-browser open http://localhost:8000/
✓ Pré-requisitos da entrada
  • O app está no ar e responde
  • A tela-alvo é alcançável a partir da URL
  • Há credenciais de teste se houver login
  • Largura cabe no 16:9 (≤ ~1280)
✗ Quando a entrada trava
  • App offline — não há o que navegar
  • Login sem credenciais (capture só telas públicas)
  • Tela depende de dados ao vivo que somem
  • URL inacessível pela máquina que captura
💡
Confirme o link antes de qualquer roteiro

O primeiro passo prático é garantir que o link abre e que a jornada-alvo é navegável. Sem isso, todo o resto do pipeline (captura, narração, render) não tem sobre o que trabalhar.

📋 Resumo do Módulo 1.1

O que você aprendeu
  • Walkthrough = app real navegado passo a passo, narrado
  • Demonstrativo MOSTRA app; explicativo EXPLICA conceito
  • Teste de 1 pergunta: "existe uma tela para mostrar?"
  • Casos: onboarding, feature, lançamento, suporte
  • Entrega: moldura + cursor + zoom + narração
  • Saída 16:9, narrada, CTA; entrada é o link do app
Próximo módulo
1.2
🧠 Capturar antes, animar depois
O princípio que rege a skill: por que o render é determinístico, por que se captura tela real antes, e como o viewport fixo vira o espaço de coordenadas do cursor.
Ir para o módulo 1.2 →