Tutorial Veo 3.1: como criar UGC vertical 9:16 em português (passo a passo 2026)
O Veo 3.1 gera vídeo vertical 9:16 nativo em português. Tutorial passo a passo pra criar UGC faceless pra TikTok com IA: prompt, consistência e regras.

Tutorial Veo 3.1: como criar UGC vertical 9:16 em português (passo a passo 2026)
Desde a atualização de 13 de janeiro de 2026, o Veo 3.1 do Google gera vídeo vertical 9:16 nativo, em 4K, com áudio e fala. Dá pra criar UGC faceless pra TikTok e Reels sem filmar nada. Este tutorial mostra o fluxo completo: onde rodar, como prompar em português, manter consistência e publicar dentro das regras.
O que você vai aprender
- Onde rodar o Veo 3.1 (Gemini, Flow ou YouTube Shorts) e qual plano cabe no seu bolso
- Como configurar o vídeo vertical 9:16 nativo — sem cropar um vídeo horizontal
- A fórmula de prompt de 5 partes que funciona em português, com template pra copiar
- Como usar Ingredients to Video pra manter o mesmo produto/personagem em vários vídeos
- Como rotular o vídeo como IA no TikTok pra não perder alcance (ou a conta)
Vou usar um fio condutor real ao longo do tutorial: o Lucas, creator faceless que opera 5 contas de TikTok em nichos de finanças e produtos. Ele estima gastar entre 25 e 35 horas por semana só na parte operacional — e a maior fatia disso é produzir vídeo. A ideia aqui é cortar essa fatia sem cair na vala comum do "vídeo de IA que parece vídeo de IA".
Passo 1 — Escolha onde rodar o Veo 3.1 (e qual plano)
O Veo 3.1 não vive num lugar só. Você pode acessar pelo app Gemini, pelo Flow (o estúdio de vídeo do Google, mais completo), pelo YouTube Shorts, pela Gemini API e pelo Vertex AI. Pra UGC faceless, o Flow é o mais indicado: ele expõe os controles de aspecto, referência e upscaling num só lugar.
Qual plano assinar
O acesso vem dentro dos planos de IA do Google:
- Google AI Pro — US$ 19,99/mês: 1.000 créditos mensais, o que dá aproximadamente 100 vídeos no Veo 3.1 Lite, 50 no Fast ou 10 no Quality.
- Google AI Ultra — US$ 249,99/mês: 25.000 créditos, cerca de 5.000 Lite, 2.500 Fast ou 250 Quality.
Cada clipe do Veo 3.1 dura cerca de 8 segundos. Os três modos consomem créditos diferentes: Lite gasta 10 créditos, Fast 20 (10 no Ultra) e Quality 100 créditos por geração.
Tradução pro creator faceless: o Lucas, no plano Pro de US$ 19,99, consegue gerar perto de 50 clipes Fast por mês. Se ele encadeia 3 clipes por vídeo, são uns 16 vídeos completos saindo de um plano de entrada. Pra escalar pra 5 contas postando todo dia, ou ele sobe pro Ultra, ou usa a API por segundo (US$ 0,50/s sem áudio, US$ 0,75/s com áudio) e paga só o que rodar.
A decisão aqui é a mesma de qualquer ferramenta: comece no Pro, valide o estilo que converte, e só depois escale o volume. Não assine o Ultra pra "testar".
Passo 2 — Configure o vídeo vertical 9:16 nativo
Esse é o pulo do gato da atualização de janeiro. Antes, todo mundo gerava em 16:9 e cropava pra vertical, perdendo enquadramento. Agora o Veo 3.1 compõe para 9:16 desde o início: posicionamento do sujeito, coreografia da ação, fundo e foco visual são todos otimizados pra tela vertical.
Na prática
- No Flow, abra um novo projeto e, antes de escrever o prompt, selecione o aspecto 9:16.
- Escolha a resolução. O Veo 3.1 entrega 4K nativo (3840×2160), mas pra TikTok/Reels o 1080p já basta e gasta menos. Deixe o upscale pra 4K só pra peça que você sabe que vai escalar.
- Confirme que o modo (Lite/Fast/Quality) bate com o orçamento do Passo 1.
Erro comum: gerar em 16:9 "porque o exemplo do tutorial gringo era assim" e depois cropar. Você perde a composição vertical que o modelo construiu de propósito. Escolha 9:16 na origem.
Passo 3 — Escreva o prompt na fórmula de 5 partes
Prompt de vídeo não é prompt de chatbot. O que funciona no Veo 3.1 é uma estrutura de cinco blocos:
[Composição do plano] + [Detalhes do sujeito] + [Ação] + [Cenário/ambiente] + [Estética/clima]
A regra de ouro: 3 a 6 frases, entre 100 e 150 palavras. Prompt curto demais deixa o modelo "chutar"; longo demais vira ruído.
Template em português pra copiar
Plano fechado em uma mão segurando um pote de creme branco sem marca,
luz natural de janela vindo da esquerda, sobre uma bancada de madeira clara.
A mão gira o pote lentamente mostrando a textura. Câmera faz um leve push-in.
Ambiente de cozinha minimalista, manhã. Estética documental, tom quente,
foco nítido no produto, granulação de filme sutil.
Repare: nada de pedir "vídeo viral" ou "estilo TikTok". Você descreve o que a câmera vê, e o resto é consequência. O Veo entende português tanto no prompt quanto na fala que você quiser que apareça no vídeo.
Onde a criaUGC entra (beta): prompar bem é uma habilidade — e prompar 40 vezes por semana, mantendo o mesmo tom em 5 contas diferentes, é um trabalho operacional. A criaUGC nasceu pra essa camada: transformar a sua linha editorial em prompts consistentes por conta, em vez de você reescrever do zero toda vez. Ela não substitui o Veo — orquestra o uso dele na sua escala.
Passo 4 — Use "Ingredients to Video" pra manter consistência
Esse é o recurso que torna o Veo 3.1 viável pra faceless de verdade. Com Ingredients to Video, você sobe até 3 imagens de referência — de um produto, um personagem ou um objeto — e o modelo mantém a identidade visual consistente entre cenas, ângulos e cenários. Mesmo com prompts mais curtos, as expressões e os movimentos ficam melhores.
Por que isso importa pro faceless
Uma conta faceless vive de reconhecimento. Se o "mascote", o produto ou a paleta muda a cada vídeo, você não constrói memória visual — e memória visual é o que faz o algoritmo e o público colarem na conta.
Na prática
- Reúna 2-3 imagens da sua "âncora visual": o frasco do produto, o boneco/avatar, a mão com a mesma pulseira, sempre que possível.
- Suba como referência (Ingredients) antes de gerar.
- Escreva o prompt focando na ação e no clima — a identidade já vem das imagens.
Lucas, na prática: ele fixou 3 referências por conta (uma paleta, um produto-âncora e um cenário recorrente). Resultado: os vídeos de cada conta passaram a "parecer da mesma conta" sem ele desenhar nada à mão. É exatamente o tipo de coisa que a criaUGC guarda como estilo por conta (beta) — pra você não recarregar as referências manualmente toda santa vez.
Passo 5 — Dirija a câmera e a fala
O Veo 3.1, sem instrução de câmera, tende a ficar estático ou com um leve tremor de mão. Se você quer movimento, peça explicitamente.
Movimentos de câmera que funcionam
- Push-in / dolly: câmera se aproxima do produto (ótimo pra revelar textura).
- Tracking: câmera acompanha o sujeito pelo espaço.
- Pan: rotação horizontal.
- POV: primeira pessoa — funciona muito pra "demonstração na mão".
Fala em português
Pra UGC com narração ou depoimento, a regra é dura: fala curta. Como o clipe tem ~8 segundos, escreva uma linha que caiba em uma respiração. Use aspas pra marcar a fala e descreva a voz e a emoção:
Uma jovem fala, sorrindo, em tom de confidência: "esse aqui mudou minha pele
em duas semanas". Voz natural, próxima do microfone.
Mantém curto, soa humano. Linha longa demais o modelo atropela ou corta.
Passo 6 — Monte a sequência (8s vira 30s)
Um clipe de 8 segundos não é um vídeo de TikTok — é um bloco. UGC bom encadeia blocos numa estrutura de batida. Um exemplo de revelação de produto em 8 segundos:
- 0–3s: abre num estúdio escuro e minimalista, produto em silhueta suave, câmera firme.
- 3–6s: entra uma luz lateral lenta enquanto a câmera empurra de leve, revelando forma e textura.
- 6–8s: produto entra em foco total, close limpo, assentamento confiante.
Gere cada bloco como um clipe, encadeie 3-4 deles (gancho → demonstração → prova → CTA) e você tem um vídeo de 24-32 segundos. Por fim, rode o upscale pra 1080p ou 4K na peça final — disponível no Flow, na Gemini API e no Vertex AI.
Sem criaUGC vs com criaUGC (estimativa ilustrativa): montar manualmente — prompar, gerar, baixar, reorganizar os blocos, exportar — pode tomar algumas horas por dia quando você roda várias contas. A proposta da criaUGC (beta) é colapsar a parte chata desse ciclo (fila de prompts, versionamento por conta, encadeamento) pra você gastar o tempo no que importa: o gancho e a oferta. Os números variam por pessoa e volume — trate como ordem de grandeza, não promessa.
Passo 7 — Rotule como IA e publique (sem perder alcance)
Esse passo não é opcional — e é onde muito creator toma strike sem entender por quê.
Desde 2026, as diretrizes do TikTok sobre mídia sintética exigem divulgação explícita de conteúdo gerado por IA em todos os formatos: orgânico, branded content e anúncio. Você declara pela legenda, sticker, marca d'água ou pelo próprio toggle de "conteúdo gerado por IA" do app.
Por que levar a sério
- O TikTok removeu 51.618 vídeos de mídia sintética no segundo semestre de 2025 — alta de 340% sobre 2024.
- Não rotular pode custar remoção do vídeo, redução de alcance e, em casos graves, suspensão da conta.
- O TikTok já integra C2PA Content Credentials (desde janeiro de 2025) e detecta IA por metadados e marca d'água invisível — ou seja, dá pra detecção automática mesmo se você não rotular.
A boa notícia
O próprio TikTok afirma que ligar o rótulo de IA não prejudica a distribuição, desde que o vídeo siga as diretrizes da comunidade. Ou seja: rotular é de graça em termos de alcance e te protege. Não rotular é apostar a conta.
Checklist de publicação
- Ative o toggle de "conteúdo gerado por IA" ao postar.
- Garanta que o áudio (música/voz) também está em conformidade.
- Agende no horário ótimo de cada conta.
- Acompanhe retenção nos 3 primeiros segundos — é o número que decide se o vídeo anda.
Onde a criaUGC fecha o ciclo (beta): rotular, agendar por conta e ler a retenção de 5 contas em planilhas separadas é o tipo de tarefa que come a semana. A criaUGC foi pensada pra juntar criar → agendar → medir num lugar só, com o estilo de cada conta preservado — o pedaço que nenhum gerador de vídeo, sozinho, resolve.
Resumo do fluxo
| Passo | O que fazer | Cuidado principal |
|---|---|---|
| 1 | Escolher Flow + plano (Pro/Ultra) | Não assinar Ultra "pra testar" |
| 2 | Selecionar 9:16 nativo | Não gerar 16:9 e cropar |
| 3 | Prompt de 5 partes, 100-150 palavras | Descrever o que a câmera vê, não "viral" |
| 4 | Ingredients: até 3 referências | Fixar âncora visual por conta |
| 5 | Dirigir câmera + fala curta (~8s) | Pedir movimento explícito |
| 6 | Encadear blocos de 8s + upscale | Estruturar em batidas (0-3/3-6/6-8) |
| 7 | Rotular IA + agendar | Rótulo é obrigatório, não opcional |
FAQ
O Veo 3.1 funciona em português?
Sim. Você escreve o prompt em português e o modelo também gera fala em português dentro do vídeo. O segredo é a estrutura do prompt (descrever plano, sujeito, ação, cenário e clima), não o idioma.
Quanto custa pra fazer UGC com Veo 3.1?
O acesso vem nos planos do Google: AI Pro a US$ 19,99/mês (1.000 créditos ≈ ~50 vídeos no modo Fast) ou AI Ultra a US$ 249,99/mês (25.000 créditos). Pra quem usa a API, o custo é por segundo: US$ 0,50/s só vídeo, US$ 0,75/s com áudio.
Qual a diferença entre Veo 3.1 Lite, Fast e Quality?
São tiers de qualidade e custo. Lite gasta 10 créditos por geração, Fast 20 (10 no Ultra) e Quality 100. Pra rascunho e teste de gancho, use Lite/Fast; pra a peça final que vai escalar, use Quality e faça upscale.
Preciso rotular meu vídeo do Veo como IA no TikTok?
Sim, é obrigatório desde 2026 para todo conteúdo gerado por IA. Não rotular pode levar a remoção, queda de alcance ou suspensão — e o TikTok detecta IA automaticamente via C2PA. Rotular não prejudica a distribuição se o vídeo seguir as diretrizes.
O Veo 3.1 gera 9:16 de verdade ou é só crop?
De verdade. Desde janeiro de 2026 ele compõe nativamente para 9:16 — sujeito, ação e fundo são otimizados pra tela vertical, em vez de cortar um quadro horizontal.
Quanto tempo dura um clipe?
Cerca de 8 segundos por geração. Pra um vídeo de TikTok completo, você encadeia 3-4 clipes numa estrutura de gancho → demonstração → prova → CTA.
Dá pra manter o mesmo "personagem" ou produto em vários vídeos?
Sim — é pra isso que serve o Ingredients to Video. Você sobe até 3 imagens de referência e o modelo mantém a identidade visual consistente entre cenas e ângulos. É o recurso-chave pra contas faceless que precisam de reconhecimento.
Conclusão
O Veo 3.1 resolveu a parte mais difícil do UGC faceless: gerar vídeo vertical 9:16 nativo, em português, com consistência de marca via referências. Mas gerar um clipe bonito é o começo. O trabalho que consome a semana é o operacional em escala — prompar com consistência por conta, encadear, rotular, agendar e ler os dados de várias contas ao mesmo tempo.
É exatamente essa camada que a criaUGC está construindo: uma plataforma all-in-one que aprende o estilo de cada conta e junta criar, agendar e medir num lugar só, pra creator brasileiro que posta todo dia sem aparecer. Entre na waitlist da criaUGC e seja avisado quando o beta abrir.
A criaUGC não é afiliada ao Google, Veo, Gemini, Flow, TikTok, Instagram ou YouTube. Os nomes citados pertencem a seus respectivos donos e foram usados apenas para fins informativos e de comparação. Preços, créditos e regras de plataforma podem mudar — confirme sempre na fonte oficial antes de assinar. Este conteúdo tem caráter educativo e não constitui promessa de resultado.