Skip to content

Gemini Omni Flash Videostudio

Entwurfsaufforderungen für die multimodale Videogenerierung und Videobearbeitung in natürlicher Sprache, inspiriert vom Gemini Omni-Modell von Google.

Model
Gemini Omni Flash model preview
Gemini Omni FlashPreview

Multimodal video generation and editing

Erstellungstyp

Funktioniert am besten mit Motiv, Bewegung, Kamera, Audio, Referenzeingaben und beizubehaltenden Einschränkungen.

Offizielle Gemini Omni-Beispiele

Referenzclips aus der Ankündigung von Google zeigen die Text-zu-Video-Erstellung, Bearbeitungen in natürlicher Sprache, multimodale Referenzen und fundierte Physik.

Gemini Omni Flash offizielles Helden-Artwork
Gemini Omni Flash-Alphabet-Montage-Videorahmen
Gemini Omni Flash offizielles Helden-Artwork
Gemini Omni Flash-Alphabet-Montage-Videorahmen
Zum Vergleichen ziehen

Alphabetische Montage, generiert aus einer komplexen Textaufforderung.

Gemini Omni Flash KI-Videogenerator

Gemini Omni Flash ist Googles erstes Gemini Omni-Modell: ein multimodales Videosystem zum Erstellen von Clips aus Text-, Bild-, Video- und Audioreferenzen und deren anschließende Verfeinerung durch Konversationsbearbeitungen.

Probieren Sie Gemini Omni Flash Prompts aus
Gemini Omni Flash official announcement artwork
Was ist Gemini Omni Flash?

Ein Gemini-Videomodell, das für die Erstellung und Bearbeitung erstellt wurde

Gemini Omni Flash ist das erste Modell in der Gemini Omni-Familie von Google. Google präsentiert es als eine Möglichkeit, aus jeder Eingabe etwas zu erstellen, einschließlich Text-, Bild-, Video- und Sprachreferenzen, und es dann mit natürlicher Konversationssprache weiter zu bearbeiten.

Das Modell ist für mehr als eine One-Shot-Generation ausgelegt. Die offiziellen Beispiele zeigen Multi-Turn-Schnitt, Stiländerungen, Bewegungsübertragung, Materialtransformationen, Kamerawinkeländerungen und audiobewusstes visuelles Timing.

Für Ersteller und Teams liegt der praktische Wert in einer schnelleren Iteration: Beginnen Sie mit einer Aufforderung oder Referenz, nehmen Sie spezifische Änderungen in einfacher Sprache vor und sorgen Sie dafür, dass der Clip in Bezug auf Bewegung, Stil, Ton und Geschichte kohärent bleibt.

Video mit beliebiger Eingabe

Erstellen Sie Videos aus Text, Bildern, Videoreferenzen und unterstützter Spracheingabe.

Konversationsbearbeitungen

Iterieren Sie mit natürlicher Sprache und behalten Sie dabei Thema, Timing und Bewegung bei.

SynthID Transparenz

Laut Google enthalten alle Omni-Videos das nicht wahrnehmbare Wasserzeichen SynthID.

Gemini Omni Flash multimodal video model overview

Gemini Omni Flash overview

Create from references, edit by conversation, and preserve coherent motion.

Warum Gemini Omni Flash wichtig ist

Ein neuer Workflow für die KI-Videoerstellung

Gemini Omni Flash vereint Generierung, Bearbeitung, Referenzverständnis und Weltwissen in einem Video-Workflow.

Text zu Video

Verwandeln Sie kompakte Aufforderungen in filmische Clips, Erklärungen, Bewegungsstudien und gesellige Szenen.

Aufforderung zum Videofilmische Bewegungkurze Clips

Bearbeitung natürlicher Sprache

Bitten Sie um Bearbeitungen wie neue Materialien, veränderte Umgebungen, unsichtbare Objekte oder neue Kamerawinkel.

Multiturn-BearbeitungenKlartextschnellere Iteration

Multimodale Referenzen

Kombinieren Sie Bilder, Videos, Text und unterstützte Sprachreferenzen in einer zusammenhängenden Ausgabe.

BildreferenzBewegungsübertragungAudio-Timing

Weltwissen und Physik

Nutzen Sie das Wissen und das verbesserte physikalische Denken von Gemini für aussagekräftigere und glaubwürdigere Szenen.

gravityFluiddynamikvisuelle Erklärer

Videos erstellen, bearbeiten und erneut referenzieren

Verwenden Sie Gemini Omni Flash für die von Google hervorgehobenen Arbeitsabläufe: Texterstellung, iterative Bearbeitung und referenzbasierte Komposition.

Text-zu-Video-Konzeption

Text-zu-Video-Konzeption

Beginnen Sie mit einem kompakten kreativen Briefing und erstellen Sie einen Clip mit Bewegung, Kamerasprache und Tonregie.

Videobearbeitung in natürlicher Sprache

Videobearbeitung in natürlicher Sprache

Ändern Sie Materialien, entfernen Sie Objekte, ändern Sie Kamerawinkel oder gestalten Sie eine Szene neu, ohne manuelle Zeitleistenarbeit.

Referenzbasierte Produktion

Referenzbasierte Produktion

Verwenden Sie Referenzmedien für Identität, Bewegung, Stil und Audio-Timing und fügen Sie sie dann zu einer einzigen Ausgabe zusammen.

Offizielle Referenzmedien

Gemini Omni Flash-Videobeispiele

Diese Clips verweisen auf Medien aus der Ankündigung Gemini Omni von Google und werden eingefügt, um die Arten von Generierungs- und Bearbeitungsworkflows zu zeigen, die im Artikel demonstriert werden.

Quelle: Google Blog

Komplexe Textaufforderungsmontage

Eine Alphabetsequenz verwendet schnelle Objektwechsel, untere Drittel und Musik aus einer detaillierten Eingabeaufforderung.

Create an alphabet montage with unusual objects, matching lower thirds, and calm music.

Liquid Mirror Bearbeiten

Eine Bearbeitung in natürlicher Sprache verwandelt einen Spiegel in eine kräuselnde Flüssigkeit und einen Arm in reflektierendes Material.

Make the mirror ripple beautifully like liquid and make the arm reflective.

Multi-Turn Violin Edit

Der Artikel demonstriert das Ändern desselben Geigenclips über mehrere Bearbeitungen hinweg, einschließlich des Entfernens des sichtbaren Instruments.

Make the violin invisible while keeping the performance coherent.

Physikalische Kettenreaktion

Eine Murmel rollt durch eine Kettenreaktionsbahn mit kontinuierlicher Bewegung und Ton.

A marble rolling fast on a chain reaction style track, continuous smooth shot.

Bild-, Video- und Audioreferenz

Ein Science-Fiction-Clip kombiniert Bild-, Video- und Audioreferenzen in einer synchronisierten Ausgabe.

Use image, motion video, and audio timing references to create a dynamic sci-fi clip.

Zeichnen zu realistischem Filmmaterial

Eine Zeichnung leitet die Bewegung, während das Endergebnis zu realistischem Filmmaterial wird.

Turn the drawing into realistic footage while using it only as a guide for movement.

So planen Sie Omni-Eingabeaufforderungen

Drei Schritte zu besseren Gemini Omni Flash-Eingabeaufforderungen

Das Modell belohnt klare Absichten, konkrete Referenzrollen und explizite Anweisungen dazu, was bei Änderungen stabil bleiben soll.

Gemini Omni Flash step 1 source inputs
1

Wählen Sie die Quelleingänge aus

Entscheiden Sie, ob der Clip mit Text, Bild, Video, Audio oder einer Kombination von Referenzen beginnt.

Gemini Omni Flash step 2 natural language edit
2

Beschreiben Sie Bewegungen und Einschränkungen

Benennen Sie das Motiv, die Bewegung, den Kamerapfad, den Stil, das Audio-Timing und die Details, die Gemini Omni Flash bewahren soll.

Gemini Omni Flash step 3 multi-turn edit
3

Iterieren Sie im Gespräch

Führen Sie anschließend präzise Bearbeitungen wie Materialänderungen, Kamerawinkeländerungen, Stilübertragungen oder Objektentfernungen durch.

Gemini Omni Flash physics and world knowledge example

Bodenvideo im Weltwissen von Gemini

Google beschreibt Omni als eine Kombination aus visueller Generierung und Geminis Wissen über Physik, Wissenschaft, Geschichte und kulturellen Kontext. Das trägt dazu bei, dass Clips mehr als nur visuell plausibel werden: Sie können eine klarere Bedeutung vermitteln und komplexe Ideen besser erklären.

Gemini Omni Flash transparency and reference motion example

Entworfen mit Transparenzsignalen

In der offiziellen Ankündigung heißt es, dass alle Omni-Videos das nicht wahrnehmbare digitale Wasserzeichen SynthID von Google enthalten und die Verifizierung über Gemini-App-Oberflächen, Gemini in Chrome und die Google-Suche unterstützt werden.

Planen Sie Ihr nächstes Video im Omni-Stil

Schreiben Sie eine bessere Gemini Omni Flash-Eingabeaufforderung

Nutzen Sie das Prompt-Studio oben, um eine kreative Idee in ein strukturiertes Briefing für Text-to-Video, referenzbasiertes Video oder Konversationsbearbeitung umzuwandeln.

Text-, Bild-, Video- und Audioreferenzen
Multiturn-Bearbeitungen in natürlicher Sprache
Offizielle Google-Beispielmedien
SynthID Transparenzhinweise
Gemini Omni Flash-FAQ

Häufig gestellte Fragen