Veo 3, a IA do Google para criar vídeos realistas com áudio, também está disponível na Itália

O Veo 3, modelo de inteligência artificial do Google que permite gerar vídeos realistas com áudio sincronizado, também está disponível na Itália.
Usuários assinantes do Gemini Pro , um plano mensal que custa cerca de 22 euros e permite acesso aos recursos avançados da inteligência artificial do Google, agora têm acesso a uma versão aprimorada do modelo, chamada " Veo 3 Fast ", também disponível em nosso país. Esta variante é capaz de gerar vídeos com o dobro da velocidade da versão padrão. Os vídeos criados com o Veo 3 Fast têm resolução de 720p e duram no máximo oito segundos.
Assinantes "Pro" podem criar até três vídeos. Após esse limite diário, o aplicativo voltará automaticamente a usar o modelo anterior, o Veo 2 .
O que é Veo 3Ao contrário do modelo anterior — Veo 2 — e de ferramentas como o Sora da OpenAI , o Veo 3 não se limita a gerar imagens em movimento. Ele integra efeitos sonoros , ruídos ambientais e até diálogos, sincronizando-os perfeitamente com a ação do vídeo. A IA do Google é, portanto, capaz de produzir vídeos com pessoas falando, em vários idiomas, incluindo italiano . O curioso é que o Veo 3 é capaz até de reproduzir, de forma mais ou menos convincente, as nuances dos dialetos.
Construído em uma arquitetura de transformador de difusão, o Veo 3 aproveita os enormes recursos computacionais do Google e provavelmente uma parte significativa do arquivo de vídeos do YouTube para seu treinamento, embora a DeepMind — a equipe por trás da IA mais avançada do Big G — esteja sendo deliberadamente vaga nos detalhes.
O resultado é um modelo que consegue entender as leis da física do mundo real e honrar narrativas complexas, gerando clipes de 8 segundos surpreendentemente realistas.
A capacidade do Veo 3 de lidar com prompts diferenciados — especificando ângulos de câmera, estilos de arte ou até mesmo diálogos — claramente o diferencia da concorrência.
Por exemplo, um prompt descrevendo um marinheiro apontando para um mar tempestuoso enquanto recita poesia gera um vídeo com ondas quebrando, vento uivante e a voz do marinheiro perfeitamente sincronizada com seus movimentos labiais.
Entretanto, o Veo 3 não está livre de falhas : gestos manuais complexos, como contar com os dedos, podem ser difíceis, provavelmente devido à má representação nos dados de treinamento.
Mas a capacidade deste modelo de simular a física de forma realista — como uma aurora boreal dançando no céu do Ártico — faz com que seus vídeos pareçam filmagens reais e profissionais.
O que torna o Veo 3 verdadeiramente revolucionário é sua fusão nativa de vídeo e áudio , uma conquista técnica que há muito tempo é um desafio para desenvolvedores de IA.
Ao contrário de modelos concorrentes como o Runway ou o próprio Sora , que frequentemente exigem sincronização de áudio pós-produção, o Veo 3 gera ambos os modos simultaneamente, garantindo sincronização labial perfeita e coerência sonora ambiente. Isso não é apenas um avanço tecnológico: é uma mudança de paradigma. Uma mudança que pode impulsionar a criatividade, mas também gerar conteúdo controverso e ofensivo.
A espera acabou. @GeminiApp agora está distribuindo o Veo 3 *globalmente* para todos os membros Pro! Isso significa que Índia, Indonésia, toda a Europa e outros países estão começando a ter acesso para criar vídeos agora mesmo. Como membro, você terá 3 gerações de vídeos por dia, e esse crédito será reposto... pic.twitter.com/uPa0p0KQZu
— Josh Woodward (@joshwoodward) 3 de julho de 2025
Para neutralizar qualquer abuso, cada quadro é marcado digitalmente com a marca d'água SynthID do Google, invisível a olho nu, mas teoricamente rastreável. E, há algumas semanas, um pequeno texto, "Veo", também está presente no canto inferior direito dos vídeos gerados.
No entanto, essa medida não garante que usuários menos atentos — por exemplo, aqueles que rolam rapidamente pelo conteúdo nas redes sociais — percebam que estão assistindo a um vídeo gerado por IA.
Vídeos racistas gerados por IA estão circulando no TikTok e parecem ter sido criados com o Veo 3 [o “Veo” no canto inferior direito não deixa dúvidas].
Nos vídeos em questão, pessoas negras são retratadas como macacos ou criminosos. A IA do Google também tem sido usada para construir narrativas falsas ou enganosas sobre migrantes.
Esses conteúdos estão conquistando milhões de visualizações, apesar de espalharem imagens profundamente ofensivas e preconceituosas.
La Repubblica