Skip to content

Studio Gemini Omni Flash

Rédigez des invites pour la génération vidéo multimodale et les montages vidéo en langage naturel inspirés du modèle Gemini Omni de Google.

Model
Gemini Omni Flash model preview
Gemini Omni FlashPreview

Multimodal video generation and editing

Type de création

Fonctionne mieux avec le sujet, le mouvement, la caméra, l'audio, les entrées de référence et les contraintes à préserver.

Exemples officiels Gemini Omni

Les extraits de référence de l'annonce de Google montrent la création de texte en vidéo, les modifications en langage naturel, les références multimodales et la physique ancrée.

Illustration officielle du héros Gemini Omni Flash
Cadre vidéo de montage alphabet Gemini Omni Flash
Illustration officielle du héros Gemini Omni Flash
Cadre vidéo de montage alphabet Gemini Omni Flash
Faites glisser pour comparer

Montage alphabétique généré à partir d'une invite de texte complexe.

Générateur vidéo IA Gemini Omni Flash

Gemini Omni Flash est le premier modèle Gemini Omni de Google : un système vidéo multimodal permettant de créer des clips à partir de références de texte, d'images, de vidéo et d'audio, puis de les affiner avec des modifications conversationnelles.

Essayez les invites Gemini Omni Flash
Gemini Omni Flash official announcement artwork
Qu'est-ce que le Gemini Omni Flash ?

Un modèle vidéo Gemini conçu pour la création et l'édition

Gemini Omni Flash est le premier modèle de la famille Gemini Omni de Google. Google le présente comme un moyen de créer n'importe quoi à partir de n'importe quelle entrée, y compris des références de texte, d'image, de vidéo et de voix, puis de continuer à éditer avec un langage conversationnel naturel.

Le modèle est conçu pour plus d’une génération unique. Les exemples officiels montrent l'édition multi-tours, les changements de style, le transfert de mouvement, les transformations de matériaux, les changements d'angle de caméra et le timing visuel prenant en charge l'audio.

Pour les créateurs et les équipes, la valeur pratique réside dans une itération plus rapide : commencez par une invite ou une référence, effectuez des modifications spécifiques dans un langage simple et maintenez la cohérence du clip en termes de mouvement, de style, de son et d'histoire.

Vidéo à toute entrée

Créez une vidéo à partir de texte, d'images, de références vidéo et de saisies vocales prises en charge.

Modifications conversationnelles

Itérez avec le langage naturel tout en préservant le sujet, le timing et le mouvement.

SynthID transparence

Google affirme que toutes les vidéos Omni incluent son filigrane imperceptible SynthID.

Gemini Omni Flash multimodal video model overview

Gemini Omni Flash overview

Create from references, edit by conversation, and preserve coherent motion.

Pourquoi Gemini Omni Flash est important

Un nouveau flux de travail pour la création de vidéos IA

Gemini Omni Flash combine la génération, l'édition, la compréhension des références et la connaissance du monde dans un seul flux de travail vidéo.

Texte en vidéo

Transformez des invites compactes en clips cinématiques, explicatifs, études de mouvement et scènes prêtes pour les réseaux sociaux.

invite à la vidéomouvement cinématographiqueclips courts

Édition en langage naturel

Demandez des modifications telles que de nouveaux matériaux, des environnements modifiés, des objets invisibles ou de nouveaux angles de caméra.

modifications multitourslangage clairitération plus rapide

Références multimodales

Mélangez des images, des vidéos, du texte et des références vocales prises en charge en une seule sortie cohérente.

référence de l'imagetransfert de mouvementsynchronisation audio

Connaissance du monde et physique

Utilisez les connaissances de Gemini et son raisonnement physique amélioré pour des scènes plus significatives et crédibles.

gravitydynamique des fluidesexplicateurs visuels

Créer, éditer et référencer une vidéo

Utilisez Gemini Omni Flash pour les flux de travail mis en avant par Google : création de texte, édition itérative et composition basée sur des références.

Conception texte-vidéo

Conception texte-vidéo

Partez d’un brief créatif compact et générez un clip avec le mouvement, le langage de la caméra et la direction du son.

Montages vidéo en langage naturel

Montages vidéo en langage naturel

Modifiez les matériaux, supprimez des objets, modifiez les angles de caméra ou relookez une scène sans travail manuel sur la chronologie.

Production basée sur la référence

Production basée sur la référence

Utilisez des médias de référence pour l’identité, le mouvement, le style et le timing audio, puis mélangez-les en une seule sortie.

Médias de référence officiels

Exemples de vidéos Omni Flash Gemini

Ces clips font référence aux médias de l'annonce Gemini Omni de Google et sont inclus pour montrer les types de flux de travail de génération et d'édition présentés dans l'article.

Source : Blog Google

Montage d'invite de texte complexe

Une séquence alphabétique utilise des changements d'objet rapides, des tiers inférieurs et de la musique à partir d'une invite détaillée.

Create an alphabet montage with unusual objects, matching lower thirds, and calm music.

Miroir liquide Modifier

Un montage en langage naturel transforme un miroir en liquide ondulant et transforme un bras en matériau réfléchissant.

Make the mirror ripple beautifully like liquid and make the arm reflective.

Violon multi-tours Modifier

L'article montre la modification du même clip de violon lors de plusieurs modifications, y compris la suppression de l'instrument visible.

Make the violin invisible while keeping the performance coherent.

Réaction en chaîne physique

Une bille roule sur une piste de réaction en chaîne avec un mouvement et un son continus.

A marble rolling fast on a chain reaction style track, continuous smooth shot.

Image + Vidéo + Référence Audio

Un clip de science-fiction combine des références image, vidéo et audio en une seule sortie synchronisée.

Use image, motion video, and audio timing references to create a dynamic sci-fi clip.

Dessiner sur des images réalistes

Un dessin guide le mouvement tandis que le résultat final devient une séquence réaliste.

Turn the drawing into realistic footage while using it only as a guide for movement.

Comment planifier les invites Omni

Trois étapes pour améliorer les invites Gemini Omni Flash

Le modèle récompense une intention claire, des rôles de référence concrets et des instructions explicites sur ce qui doit rester stable pendant les modifications.

Gemini Omni Flash step 1 source inputs
1

Choisissez les entrées sources

Décidez si le clip commence à partir de texte, d’image, de vidéo, d’audio ou d’une combinaison de références.

Gemini Omni Flash step 2 natural language edit
2

Décrire le mouvement et les contraintes

Nommez le sujet, le mouvement, le chemin de la caméra, le style, la synchronisation audio et les détails que Gemini Omni Flash doit préserver.

Gemini Omni Flash step 3 multi-turn edit
3

Itérer de manière conversationnelle

Effectuez des modifications précises telles que des modifications de matériaux, des changements d'angle de caméra, un transfert de style ou la suppression d'objets.

Gemini Omni Flash physics and world knowledge example

Vidéo au sol dans la connaissance mondiale de Gemini

Google décrit Omni comme combinant la génération visuelle avec les connaissances de Gemini en matière de physique, de science, d'histoire et de contexte culturel. Cela aide les clips à devenir plus que visuellement plausibles : ils peuvent avoir un sens plus clair et mieux expliquer des idées complexes.

Gemini Omni Flash transparency and reference motion example

Conçu avec des signaux de transparence

L'annonce officielle indique que toutes les vidéos Omni incluent le filigrane numérique imperceptible SynthID de Google, avec prise en charge de la vérification via les surfaces d'application Gemini, Gemini dans Chrome et la recherche Google.

Planifiez votre prochaine vidéo de style Omni

Écrivez une meilleure invite Gemini Omni Flash

Utilisez le studio d'invite ci-dessus pour transformer une idée créative en un brief structuré pour la conversion texte-vidéo, une vidéo basée sur des références ou un montage conversationnel.

Références texte, image, vidéo et audio
Modifications multitours en langage naturel
Exemples de médias officiels de Google
Notes transparentes SynthID
FAQ Gemini Omni Flash

Foire aux questions