Gemini Omni : le modèle vidéo IA qui a fuité avant I/O 2026

Le 11 mai 2026, des utilisateurs ont repéré dans l'application Gemini de Google un nouveau générateur de vidéo appelé Omni. Sa promesse : créer des vidéos à partir d'une description écrite, puis les modifier en discutant avec l'IA, sans passer par un logiciel de montage. La fuite tombe à huit jours de la grande conférence annuelle de Google (Google I/O 2026, les 19 et 20 mai), avec une limite actuelle de 10 secondes par vidéo et un appetit énorme en crédits d'utilisation : un premier testeur a consommé 86 % de son quota de la journée en faisant juste deux vidéos, alors que le même abonnement permet 15 à 20 vidéos par jour avec Veo 3.1, le générateur actuel. Plus intéressant, Omni pourrait être le premier outil IA capable de produire image, vidéo et son dans un même système, ce qu'OpenAI avait promis avec GPT-4o en 2024 sans jamais vraiment le livrer. Pour les créatifs indépendants et les agences qui produisent des visuels, le terrain change avant même l'annonce officielle.

Par

Juliann Podlunsek

Responsable projet transformation digitale & pédagogie | Consultant & Formateur IA

Publié le

May

2026

Mis à jour le

May

2026

min de lecture

À retenir

Gemini Omni est un nouveau générateur vidéo IA de Google repéré le 11 mai 2026, dont l'annonce officielle est attendue à la conférence Google I/O 2026 (19 et 20 mai).
Annoncé il y a 13 mois : Demis Hassabis, patron de la recherche IA chez Google, avait déjà expliqué en avril 2025 que Google travaillait sur un outil unique capable de produire texte, image et vidéo.
Le scénario le plus probable : un outil tout-en-un qui produit image, vidéo et son dans un même système, ce qu'OpenAI avait promis avec GPT-4o en 2024 sans jamais vraiment livrer complètement.
L'innovation clé : la modification d'une vidéo directement par discussion avec l'IA (changer un objet, retirer un logo, réécrire une scène), sans avoir à ouvrir un logiciel de montage.
Limite actuelle : 10 secondes par vidéo générée.
Consommation énorme : 2 vidéos Omni consomment autant que 15 à 20 vidéos Veo 3.1 sur le même abonnement à 20 dollars par mois, ce qui suggère un vrai saut d'architecture.
Stratégie de fond : Omni pourrait remplacer trois marques Google (Veo, Imagen, Nano Banana) par un seul outil unifié.

Après notre analyse de Krea 2 et sa nouvelle approche de la direction artistique, c'est au tour de Google de préparer un grand changement. La différence : Krea 2 se concentre sur l'image, Omni vise un terrain plus large. L'ambition : un seul outil qui sait générer une image, une vidéo et probablement un son, là où il fallait jusqu'à présent plusieurs outils différents.

Verdict en 30 secondes

Omni n'est probablement pas une simple mise à jour de Veo 3.1, le générateur vidéo actuel de Google. La consommation de crédits annoncée (deux vidéos Omni absorbent autant que 15 à 20 vidéos Veo 3.1) suggère un vrai changement d'architecture, pas une itération. Pour un créatif indépendant ou une agence, trois choses comptent.

Un : si Omni est vraiment un outil tout-en-un, c'est une première sur le marché. Cela change la donne face à ses concurrents (Seedance 2, Alibaba WAN 2.7, Kling 3.0, Runway Gen-4.5) qui restent spécialisés dans la vidéo.

Deux : la fonction qui distingue vraiment Omni, c'est la possibilité de modifier une vidéo en discutant avec l'IA. Demander à l'IA de "remplacer la voiture rouge par une moto" ou "retirer le logo en bas à droite", et l'IA refait la vidéo. Plus besoin d'ouvrir un logiciel de montage comme Premiere ou CapCut.

Trois : la consommation énorme de crédits (86 % du quota journalier en deux vidéos) indique qu'Omni ne sera pas un outil pour produire à la chaîne. Ce sera plutôt un outil premium, qualitatif. Pour une entreprise qui externalise actuellement sa production vidéo, le coût par vidéo peut chuter de 60 à 80 % une fois la chaîne intégrée. C'est exactement le terrain où notre parcours Accélérateur IA aide les freelances à structurer une offre premium.

Ce qu'on sait, ce qu'on suppose

Le 2 mai 2026, un utilisateur de la plateforme X a publié une capture d'écran de l'application Gemini. La phrase visible : "Start with an idea or try a template. Powered by Omni" ("Partez d'une idée ou essayez un modèle. Propulsé par Omni"). Ce nom apparaît juste à côté de Toucan, le nom de code interne du générateur vidéo actuel de Google (Veo 3.1). Selon TestingCatalog, un site spécialisé dans le suivi des nouveautés Google, ce type d'affichage précède généralement de quelques jours le remplacement officiel d'un produit.

Le 11 mai, un abonné à la version payante de Gemini a obtenu un accès en avance et a partagé deux vidéos générées. Le message d'accueil d'Omni dans l'application disait : "Voici notre nouveau générateur de vidéo. Remixez vos vidéos, modifiez-les directement en discutant avec l'IA, essayez nos modèles pré-faits, et plus encore."

Hassabis avait prévenu il y a 13 mois

Le signal le plus solide ne vient pas de la fuite, mais d'une déclaration antérieure. En avril 2025, dans un podcast avec l'investisseur Reid Hoffman, Demis Hassabis, patron de Google DeepMind (la branche recherche IA de Google), avait annoncé que l'entreprise allait fusionner ses différents outils dans un système unique capable de gérer plusieurs types de média. Treize mois plus tard, c'est exactement ce qui apparaît dans l'application Gemini. Le plan était public, mais peu de gens l'avaient pris au sérieux.

Le parallèle GPT-4o : ce qu'OpenAI avait promis et n'a jamais vraiment livré

Le mot "Omni" n'est pas neuf dans l'industrie. En mai 2024, OpenAI sortait GPT-4o, où le "o" signifiait justement Omni. La promesse était identique : un seul modèle qui accepte texte, audio, image et vidéo en entrée et produit texte, audio et image en sortie, avec un temps de réponse audio quasi humain (320 millisecondes en moyenne). Les démonstrations sur scène étaient impressionnantes : conversation en temps réel, lecture d'émotions sur un visage, traduction simultanée.

Le problème : la version commercialisée de GPT-4o n'a jamais vraiment offert ces capacités. OpenAI a livré une version moins coûteuse en calcul, et ce qui est devenu plus tard "ChatGPT real-time" est un système différent. Le vrai modèle tout-en-un promis en démo n'a jamais été livré au grand public.

Si Google sort un vrai modèle tout-en-un avec Omni, ils seront les premiers à vraiment tenir cette promesse. C'est un argument stratégique majeur, pas un simple effet de communication.

Trois scénarios possibles le 19 mai

La communauté tech débat de trois hypothèses précises pour ce que Sundar Pichai, le PDG de Google, va annoncer en ouverture de Google I/O.

Scénario 1 : simple changement de nom. Sundar Pichai annonce Veo 4, et Omni n'est qu'un nouveau nom commercial pour le même produit. Aucun changement technique fondamental. Hypothèse faible : Google ne prépare pas une mise en scène aussi visible (fuites, nom dans l'interface, vidéos qui circulent) pour un simple rebrand. Et les leaks auraient été contredits.
Scénario 2 : deux outils côte à côte. Omni est annoncé comme un produit parallèle à Veo 4. Les créatifs gagnent un nouvel outil, Google une nouvelle marque, mais cela reste une évolution classique. Utile pour les utilisateurs, mais pas historique à l'échelle de l'industrie.
Scénario 3 : le vrai modèle tout-en-un. Sundar Pichai monte sur scène et annonce le premier modèle qui génère vidéo, image et son depuis un seul prompt, montre l'édition vidéo conversationnelle en direct, et dévoile un nouveau plan tarifaire. Si cela se produit, Google passe en tête sur tous les autres acteurs en une seule conférence. C'est ce que la roadmap publique de Demis Hassabis pointait dès 2025.

Beaucoup d'observateurs penchent pour le scénario 3, parce que c'est le seul qui justifie une nouvelle marque commerciale ("Omni") plutôt qu'une simple numérotation ("Veo 4"). Le verdict tombe le 19 mai à la conférence Google I/O.

Ce que rapportent les premiers testeurs

La modification par discussion : la vraie nouveauté

C'est probablement le point qui change le plus la donne pour les pros. Aujourd'hui, quand vous générez une vidéo avec Veo 3.1, Sora 2 ou Seedance 2, vous obtenez un fichier qu'il faut ensuite éditer dans un logiciel de montage (Premiere, DaVinci, CapCut). Omni propose une autre logique : vous décrivez la modification dans la zone de discussion ("remplace le sujet", "change la scène", "réécris l'action") et l'IA refait la vidéo.

Les premiers testeurs rapportent que la suppression de logos parasites et le remplacement d'objets dans une vidéo fonctionnent bien. C'est exactement le type de méthode que nos apprenants Studeria industrialisent dans le parcours Consultant IA.

La qualité : prometteuse mais pas révolutionnaire

Deux vidéos publiques circulent. Une vidéo montre un professeur qui écrit une démonstration mathématique (les identités trigonométriques) au tableau noir : le raisonnement mathématique est correct, le rendu est réaliste, mais quelques détails trahissent encore l'origine artificielle (gestes d'écriture mal alignés, craie qui disparaît en fin de plan).

L'autre vidéo est plus intéressante : c'est une variation du célèbre "test Will Smith mange des spaghetti", devenu un repère officieux pour mesurer la progression des générateurs vidéo IA depuis 2023. La scène montre deux hommes dans un restaurant en bord de mer. Le rendu général est réussi, mais des incohérences classiques apparaissent : des spaghetti qui apparaissent sur des assiettes vides, des gestes qui se contredisent. Sur la même description, Seedance 2.0 produit un résultat très comparable. Aucun des deux outils n'a un avantage clair sur la qualité pure.

Sur les classements de qualité vidéo, Seedance 2.0 (de l'entreprise chinoise ByteDance) reste en tête en mai 2026. Veo 3.1 garde l'avantage sur la synchronisation entre le son et l'image. Si Omni s'impose, ce ne sera pas par la qualité brute, ce sera par la combinaison qualité correcte + modification par discussion + couverture image-vidéo-son.

Limite actuelle : 10 secondes par vidéo

Selon les données techniques récupérées par un utilisateur de X, Omni est actuellement limité à 10 secondes par vidéo générée. C'est un peu plus que Veo 3.1 (8 secondes), mais cela reste très court pour du contenu narratif long. Pour des réels longs ou des storyboards, il faudra enchaîner plusieurs vidéos.

Consommation énorme : le signal d'un saut d'architecture

Un testeur a révélé que deux vidéos générées ont consommé 86 % de son quota journalier d'abonné Gemini AI Pro (la formule premium à 20 dollars par mois). Pour comparer, sur le même abonnement, Veo 3.1 permet 15 à 20 générations par jour avant d'atteindre la limite. Sora 2, quand il était encore ouvert au grand public, permettait plusieurs dizaines de clips courts.

Cette consommation extrême raconte quelque chose d'important : Omni n'est probablement pas une simple mise à jour de Veo 3.1, c'est un modèle beaucoup plus lourd, dont chaque génération mobilise des ressources de calcul bien supérieures. Cela colle parfaitement avec l'hypothèse du modèle tout-en-un, qui nécessite par définition une architecture plus puissante qu'un générateur vidéo spécialisé.

La stratégie de Google : un seul modèle pour remplacer trois marques

Aujourd'hui, Google gère plusieurs générateurs IA avec des marques séparées, des équipes différentes et des pipelines techniques distincts.

Veo pour la génération vidéo (actuellement en version 3.1)
Imagen pour la génération d'images haute qualité
Nano Banana pour la génération d'images intégrée à Gemini 3.1 Flash Image

Si l'hypothèse du modèle tout-en-un se confirme, Omni remplace ces trois marques par une seule. Pour l'utilisateur, c'est un seul outil au lieu de trois. Pour Google, c'est une simplification massive : une seule équipe, un seul modèle, une seule chaîne de production. Cette stratégie d'unification est exactement ce que poursuit Anthropic avec ses assistants IA en entreprise : un seul moteur pour plusieurs usages, plutôt qu'un assemblage hétérogène de plusieurs outils.

Omni face aux autres générateurs vidéo IA en mai 2026

Critère	Gemini Omni	Veo 3.1	Seedance 2.0
Statut	Leaké, annonce attendue le 19 mai	Disponible	Disponible
Type d'outil	Tout-en-un (image + vidéo + son)	Vidéo uniquement	Vidéo uniquement
Durée max par vidéo	10 secondes	8 secondes	Multi-plans dispo
Modification par discussion	Oui, intégrée	Non	Non
Son synchronisé	Probable (à confirmer)	Oui, dialogues et ambiance	Pas natif
Qualité visuelle pure (mai 2026)	Comparable Veo 3.1	Forte, qualité cinéma	Le mieux noté actuellement
Générations par jour (offre premium à 20 dollars)	2 vidéos = quota du jour atteint	15 à 20 vidéos	Plusieurs formules

Le reste du paysage en mai 2026

Au-delà du trio principal, deux acteurs montent en puissance et méritent d'être suivis.

Alibaba WAN 2.7 (entreprise chinoise) est considéré comme le modèle le plus complet en fonctionnalités actuellement disponible : génération de vidéo à partir de texte, d'image, modification et référence vers une vidéo, avec son synchronisé et résolution 1080p en standard.
Kling 3.0 (entreprise chinoise) propose trois variantes (standard, pro, O3) avec une qualité élevée et une vraie traçabilité commerciale en Asie.
Sora 2 (OpenAI) reste accessible uniquement par interface développeur et version pro plus chère depuis le 29 avril 2026, ne joue plus le terrain grand public.

Le paysage de la génération vidéo IA est donc plus partagé qu'il n'y paraît. Les acteurs chinois (ByteDance Seedance, Alibaba WAN, Kuaishou Kling) tiennent la tête sur la qualité pure. Google joue, lui, la carte de l'unification multi-formats et de l'édition conversationnelle.

Pourquoi Google sort Omni maintenant

Le calendrier n'est pas un hasard. Le 29 avril 2026, OpenAI a fermé l'application grand public de Sora, son générateur vidéo. L'outil reste disponible mais uniquement pour les développeurs et dans une version premium plus chère. Cela crée une ouverture commerciale stratégique : Google peut s'imposer comme la référence vidéo IA pour le grand public, là où Sora se retire.

Deuxième élément : Anthropic (l'entreprise qui développe Claude) ne propose pas de générateur vidéo, comme nous l'avons détaillé dans notre guide pour passer de ChatGPT à Claude. La compétition vidéo se joue donc principalement entre Google, OpenAI (en mode développeurs uniquement) et les acteurs asiatiques (ByteDance, Alibaba, Kuaishou).

Troisième argument : un vrai outil tout-en-un (image + vidéo + son) serait une première mondiale concrète, là où OpenAI a promis sans livrer complètement avec GPT-4o en 2024.

Quel choix selon votre profil

Pour un créatif ou vidéaste freelance

Trois actions à lancer cette semaine, avant l'annonce officielle. Premièrement, structurer une offre vidéo IA chez vos clients existants en utilisant Krea 2 pour l'image et Veo 3.1 ou Seedance 2 pour la vidéo : vous serez prêt à basculer sur Omni dès sa sortie. Deuxièmement, capitaliser sur la modification par discussion : c'est là qu'Omni va prendre de la valeur commerciale, pour produire rapidement plusieurs variantes d'une même vidéo (réels, posts sociaux). Troisièmement, packager une offre direction artistique vidéo IA facturée en plus de votre prestation habituelle. Notre Accélérateur IA pour indépendants aide à structurer ce type d'offre.

Pour une petite ou moyenne entreprise (PME) avec une équipe marketing interne

Ne courez pas sur Omni avant l'annonce officielle. En revanche, préparez le terrain : une équipe interne qui maîtrise déjà Veo 3.1 et Seedance 2 saura adopter Omni en quelques jours. Le vrai blocage n'est jamais l'outil, c'est la culture vidéo IA dans l'équipe. Pour les budgets de production externalisés, le coût d'une vidéo marketing peut chuter de 60 à 80 % une fois la chaîne intégrée, ce qui rebat les cartes entre faire en interne ou faire faire dehors. Notre formation IA en entreprise ouvre cette montee en compétence et notre dossier Former ses équipes à l'IA générative sans risquer de fuite liste les précautions à prendre.

Pour un consultant ou formateur IA

C'est un sujet à inscrire dès maintenant dans vos prochaines interventions client. Les directions marketing et communication de vos prospects vont entendre parler d'Omni la semaine du 19 mai. Anticiper, c'est positionner votre expertise. Notre parcours Consultant IA structure cette prise de position, et notre guide sur les IA conversationnelles en entreprise donne le cadre stratégique à transmettre.

Pour un salarié qui veut évoluer vers les métiers vidéo IA

Les profils hybrides (vidéo classique + maîtrise des outils génératifs) sont une vraie tension de marché en 2026. Notre Incubateur IA est le parcours dédié à cette transition et notre article Reconversion IA : les métiers d'avenir en 2026 cartographie les passerelles concrètes.

Ce que Studeria retient

Quatre constats avant la conférence Google I/O 2026.

Un. Omni n'est pas confirmé officiellement, mais la préparation (nom public visible dans l'application, données techniques récupérées, vidéos qui circulent, plan annoncé par Hassabis il y a 13 mois) ne laisse plus beaucoup de doute. Les 19 et 20 mai trancheront entre les trois scénarios : simple changement de nom, outil complémentaire à Veo, ou vrai modèle tout-en-un.

Deux. La consommation extrême de crédits (deux vidéos Omni équivalent à 15 ou 20 vidéos Veo 3.1) signale un saut d'architecture, pas une simple mise à jour. Cela renforce l'hypothèse du modèle tout-en-un, qui requiert structurellement plus de calcul qu'un générateur spécialisé.

Trois. Ce qui distingue Omni, ce n'est pas la qualité de la vidéo produite. Seedance 2 reste devant sur ce point en mai 2026, et Alibaba WAN 2.7 propose plus de fonctionnalités vidéo pures. Le vrai pari de Google, c'est la combinaison unique image + vidéo + son dans un seul outil, avec modification par discussion intégrée. C'est exactement ce qu'OpenAI avait promis avec GPT-4o en 2024 sans jamais livrer complètement. Si Google y parvient, ils prennent une avance commerciale historique.

Quatre. Il faudra combiner Omni avec d'autres outils selon la phase de production : Veo 3.1 ou Seedance 2 pour la quantité, Omni pour les variations et l'édition rapide. C'est exactement le niveau d'orchestration entre plusieurs outils que notre Accélérateur IA installe en quelques semaines.

Pour aller plus loin

Articles internes Studeria recommandés :

Parcours Studeria selon votre profil :

Accélérateur IA pour les indépendants qui veulent développer une offre vidéo IA
Consultant IA pour structurer une offre de conseil différenciante
Formation IA Entreprise pour acculturer une équipe marketing interne
Incubateur IA pour les salariés qui veulent évoluer vers les métiers vidéo IA

Sources externes consultées :

FAQ article

Qu'est-ce que Gemini Omni exactement ?

Que veut dire Omni dans Gemini Omni ?

Quand Gemini Omni sera-t-il officiellement annoncé ?

Omni est-il un saut technologique réel ou un simple changement de nom ?

Omni est-il meilleur que Sora 2, Seedance 2 ou Runway Gen-4.5 ?

Combien coûtera Gemini Omni ?

Comment se préparer à Gemini Omni en tant que pro ?

Sommaire

Text Link

Découvrez le parcours Accélérateur IA

Implémentez l’IA grâce à un accompagnement stratégique et opérationnel pour structurer, automatiser et scaler votre business

Samsung déploie ChatGPT Enterprise et Codex à ses salariés

Lire l'article

Actualités

2026

Mistral OCR 4 : faut-il l'adopter pour vos documents ?

Lire l'article

Actualités

2026

Claude Tag : déployer l'IA Anthropic dans Slack en 2026

Lire l'article

4,9/5

Boostez vos compétences

+5000 apprenants formés

Nos parcours s’adaptent à vos objectifs, à votre rythme et à votre niveau.

Nos parcours pour particuliers

4,7/5

sur 171 avis

+200 entreprises formées à l’IA

De la startup au grand groupe, nos parcours sont pensées pour déployer des solutions performantes avec l’IA .

Nos parcours entreprises

Prêt à te former ?

Trois parcours selon ton objectif : apprendre, te certifier, ou lancer ton activité.

Nos parcours pour particuliers

Formez vos équipes

Intégrez efficacement l’IA et l’automatisation dans votre entreprise.

Former mes équipes

Parcours Incubateur IA

Comprenez l’IA, gagnez du temps au quotidien et valorisez votre profil professionnel

Découvrir la formation

Parcours Consultant IA

Monétisez vos compétences IA et décrocher vos premières missions

Découvrir la formation

Parcours Accélérateur IA

Implémentez l’IA grâce à un accompagnement stratégique et opérationnel pour structurer, automatiser et scaler votre business

Découvrir la formation

Parcours Audit IA

Une approche personnalisée pour favoriser la collaboration et l’innovation

Découvrir la formation

Parcours Formation IA

Acculturation et formation de vos équipes aux outils IA métiers

Découvrir la formation

Parcours Implémentation & Agent IA

TPE, PME, ETI : Un parcours stratégique pour former vos équipes et implémenter les bons outils IA dans votre entreprise.

Découvrir la formation

Parlons-en ensemble

Prendre rendez-vous

Du dimanche 5 avril au jeudi 9 avril 2026

Le sommet IA 2026

Cinq soirées de démonstrations live, de conseils actionnables et d'échanges avec certains des entrepreneurs et experts les plus influents de France, le tout sans écrire une seule ligne de code.

Je m'inscris gratuitement

Du dimanche 28 Juin au jeudi 2 Juillet 2026

Le sommet IA 2026

Cinq soirées de démonstrations live, de conseils actionnables et d'échanges avec certains des entrepreneurs et experts les plus influents de France, le tout sans écrire une seule ligne de code.

Je m'inscris gratuitement