Le Veo 3 de Google transforme désormais une photo en vidéo complète, avec son. Voici comment procéder.

Google a introduit une nouvelle fonctionnalité au sein de son application Gemini : la possibilité de générer une courte vidéo à partir d'une seule photographie .
La particularité de cette nouvelle fonctionnalité est que la vidéo anime non seulement l'image, mais comprend également une piste audio générée automatiquement, avec des sons d'ambiance, des effets et même des dialogues .
La technologie derrière cette nouvelle fonctionnalité est Veo 3 , la troisième génération du modèle développé par Google DeepMind pour créer des vidéos à partir de texte ou d'images.
Qu'est-ce que Veo 3Dévoilé en mai dernier, le Veo 3 est capable de produire des clips vidéo d'environ huit secondes, en résolution 720p , combinant mouvement et son en une seule génération.
Veo 3 est disponible pour les abonnés Gemini Pro et Ultra dans plus de 150 pays. La fonction d'animation photo est actuellement en cours de déploiement et devrait être disponible dans Gemini dans les prochains jours.
La fonctionnalité est actuellement disponible dans la version Web de l'application Gemini, mais Google prévoit de l'étendre prochainement aux appareils mobiles.
Comment transformer une photo en vidéoLe processus est simple : connectez-vous à Gemini (nécessite un compte Google et un abonnement Pro ou Ultra), téléchargez une photo et décrivez brièvement ce que vous souhaitez, en précisant le type de son souhaité. Le système met ensuite peu de temps à vous renvoyer une vidéo animée, accompagnée du son.
La poubelle d'un appareil photo est le trésor du Veo 3. Gemini peut désormais donner vie à vos photos en les transformant en vidéos avec du son.
— Application Google Gemini (@GeminiApp) 11 juillet 2025
Ce type d'intégration représente un pas en avant par rapport à ce que permettent d'autres modèles du marché, comme Runway Gen?2, Pika Labs ou Sora d'OpenAI .
Tous ces chatbots peuvent générer des vidéos à partir de texte ou d'images, mais sans audio natif. Dans ce cas, la bande sonore doit être ajoutée séparément.
Un aspect important du système de Google est la présence de mécanismes de sécurité intégrés : toutes les vidéos sont marquées d' un filigrane - le mot « Veo », visible en bas à droite, et d'un invisible (SynthID) - pour assurer la traçabilité et empêcher une utilisation abusive du contenu généré.
La Repubblica