Fundamentos
A base. Quando um vídeo demonstrativo é a escolha certa (vs explicativo), o princípio que rege tudo — "capturar antes, animar depois" — e a stack 100% local sem chave de API: agent-browser, HyperFrames e Kokoro.
Captura do app real
A parte que mais dá errado se feita no susto. Dirigir o app com agent-browser/Playwright, descrever passos no actions.json, mirar coordenadas e bounding boxes, e lidar com scroll, inputs controlados por React e fluxos assíncronos multi-estado.
Composição & Render
Onde a captura vira vídeo: moldura de navegador, cursor animado que clica no alvo e zoom de destaque; o house style dark premium; a narração TTS local com Kokoro; e o render no HyperFrames com lint, inspect e a CTA do AutomationsAI.