What is Gemini Omni Flash?

Gemini Omni Flash is the first model in Google's Gemini Omni family, introduced for creating and editing videos from natural language and multimodal references.

Can Gemini Omni Flash edit video conversationally?

Yes. Google describes Omni as supporting natural-language, multi-turn video edits such as changing materials, environments, camera angles, and motion details.

Does Gemini Omni Flash support reference inputs?

Google says Omni can use references including image, text, video, and voice references at launch, with broader audio input support planned.

Where are the sample videos from?

The examples on this page reference media from Google's official Gemini Omni announcement article.

AI Image Editor

Gemini Omni Flash スタジオ

Google の Gemini Omni モデルにインスピレーションを得た、マルチモーダルビデオ生成と自然言語ビデオ編集のためのドラフトプロンプト。

Model

Gemini Omni FlashPreview

Multimodal video generation and editing

作成タイプ

Prompt

被写体、モーション、カメラ、オーディオ、参照入力、および保持する制約を使用する場合に最適です。

公式 Gemini オムニの例

Google の発表の参考クリップでは、テキストからビデオへの作成、自然言語編集、マルチモーダル参照、根拠のある物理学が示されています。

Gemini Omni Flash 公式ヒーローアートワーク

Gemini Omni Flash アルファベットモンタージュビデオフレーム

ドラッグして比較

複雑なテキストプロンプトから生成されたアルファベットのモンタージュ。

Gemini Omni Flash AI 動画生成

Gemini Omni Flash は、Google の最初の Gemini Omni モデルです。テキスト、画像、ビデオ、オーディオ参照からクリップを作成し、会話型編集でそれらを調整するためのマルチモーダルビデオシステムです。

Gemini Omni Flash プロンプトを試してください

出典: Google Gemini Omni の発表 Veo 4との比較画像生成を探索する

Gemini Omni Flash official announcement artwork

Gemini オムニフラッシュとは何ですか?

作成および編集用に構築された Gemini ビデオモデル

Gemini Omni Flash は、Google の Gemini Omni ファミリーの最初のモデルです。 Google は、テキスト、画像、ビデオ、音声参照などのあらゆる入力から何かを作成し、自然な会話言語で編集を続ける方法としてこれを提示しています。

このモデルは、ワンショット生成以上のものを想定して設計されています。公式の例では、マルチターン編集、スタイルの変更、モーション転送、マテリアルの変換、カメラアングルの変更、オーディオを意識したビジュアルタイミングが示されています。

クリエーターやチームにとって、実際的な価値は反復の高速化です。プロンプトまたはリファレンスから開始し、わかりやすい言葉で具体的な編集を行い、モーション、スタイル、サウンド、ストーリー全体でクリップの一貫性を保ちます。

あらゆる入力ビデオ

テキスト、画像、ビデオ参照、サポートされている音声入力からビデオを構築します。

会話形式の編集

主題、タイミング、動きを維持しながら、自然言語を反復処理します。

SynthID 透明度

Google によると、すべての Omni 動画には、目に見えない SynthID ウォーターマークが含まれています。

Gemini Omni Flash multimodal video model overview

Gemini Omni Flash overview

Create from references, edit by conversation, and preserve coherent motion.

Gemini Omni Flash が重要な理由

AI動画制作の新たなワークフロー

Gemini Omni Flash は、生成、編集、リファレンスの理解、世界の知識を 1 つのビデオワークフローに統合します。

テキストからビデオへ

コンパクトなプロンプトを映画のようなクリップ、説明、モーションスタディ、ソーシャル対応シーンに変換します。

ビデオへのプロンプト映画のような動き短編クリップ

自然言語編集

新しいマテリアル、変更された環境、目に見えないオブジェクト、新しいカメラアングルなどの編集を依頼してください。

マルチターン編集平易な言葉反復の高速化

マルチモーダルリファレンス

画像、ビデオ、テキスト、サポートされている音声リファレンスを 1 つのまとまりのある出力にブレンドします。

画像参照モーション転送オーディオのタイミング

世界の知識と物理学

Gemini の知識と改善された物理的推論を使用して、より有意義で信頼できるシーンを実現します。

gravity流体力学視覚的な説明者

ビデオの作成、編集、再参照

Gemini Omni Flash は、Google が強調したワークフロー (テキスト作成、反復編集、参照主導の構成) に使用します。

テキストからビデオへの概念

コンパクトなクリエイティブブリーフから開始して、モーション、カメラ言語、サウンドの方向を含むクリップを生成します。

自然言語ビデオ編集

手動のタイムライン作業を行わずに、マテリアルの変更、オブジェクトの削除、カメラアングルの変更、またはシーンのスタイルの変更を行うことができます。

リファレンスベースの制作

アイデンティティ、モーション、スタイル、オーディオのタイミングにリファレンスメディアを使用し、それらを 1 つの出力にブレンドします。

公式参照メディア

Gemini オムニ Flash ビデオの例

これらのクリップは、Google の Gemini Omni 発表のメディアを参照しており、記事で示されている生成および編集ワークフローの種類を示すために含まれています。

出典: Google ブログ

複雑なテキストプロンプトモンタージュ

アルファベットのシーケンスでは、1 つの詳細なプロンプトからの素早いオブジェクトの変化、ローワーサード、および音楽が使用されます。

Create an alphabet montage with unusual objects, matching lower thirds, and calm music.

リキッドミラー編集

自然言語編集により、鏡が波打つ液体に変わり、腕が反射素材に変わります。

Make the mirror ripple beautifully like liquid and make the arm reflective.

マルチターンヴァイオリン編集

この記事では、表示されている楽器を削除するなど、複数の編集にわたって同じバイオリンクリップを変更する方法を示します。

Make the violin invisible while keeping the performance coherent.

物理連鎖反応

ビー玉が連続的な動きと音声とともに連鎖反応トラックを転がります。

A marble rolling fast on a chain reaction style track, continuous smooth shot.

画像 + ビデオ + オーディオリファレンス

SF クリップは、画像、ビデオ、オーディオのリファレンスを 1 つの同期された出力に結合します。

Use image, motion video, and audio timing references to create a dynamic sci-fi clip.

リアルな映像を描画

描画によってモーションがガイドされ、最終出力はリアルな映像になります。

Turn the drawing into realistic footage while using it only as a guide for movement.

オムニプロンプトを計画する方法

Gemini Omni Flash プロンプトを改善するための 3 つのステップ

このモデルは、明確な意図、具体的な参照の役割、編集中に安定すべきものについての明示的な指示を与えます。

ソース入力を選択します

クリップがテキスト、画像、ビデオ、オーディオ、または参照の組み合わせのいずれから始まるかを決定します。

Gemini Omni Flash step 2 natural language edit

動きと拘束について説明する

Gemini Omni Flash が保持する必要がある被写体、動き、カメラパス、スタイル、オーディオタイミング、および詳細に名前を付けます。

Gemini Omni Flash step 3 multi-turn edit

会話形式で反復する

マテリアルの変更、カメラアングルの変更、スタイルの転送、オブジェクトの削除などの正確な編集をフォローアップします。

Gemini Omni Flash physics and world knowledge example

Geminiの世界知識の地上ビデオ

Google は、Omni を、物理学、科学、歴史、文化的背景に関する Gemini の知識とビジュアル生成を組み合わせたものだと説明しています。これにより、クリップは視覚的にもっともらしいものになるだけでなく、より明確な意味を伝え、複雑なアイデアをより適切に説明できるようになります。

Gemini Omni Flash transparency and reference motion example

透明性シグナルを考慮した設計

公式発表によると、すべての Omni ビデオには Google の知覚できない SynthID 電子透かしが含まれており、Gemini アプリサーフェス、Chrome の Gemini、Google 検索による検証サポートが提供されています。

さらにクリエイティブな AI ツールを探索する

オムニスタイルのビデオプランニングと画像の生成、編集、その他のメディアワークフローを組み合わせます。

Video

Veo 4 AI ビデオジェネレーター

ビデオファーストのワークフローで、テキストからビデオへのクリップや画像からビデオへのクリップを作成します。

Image

Gemini Flash画像編集

Gemini Flash スタイルのプロンプトワークフローで画像を編集します。

Editor

AI Image Editor

日常の画像変換にはプロンプトベースの編集を使用します。

Gallery

クリエイションギャラリー

幅広い AI スタジオからクリエイティブな画像やビデオを閲覧できます。

次のオムニスタイルのビデオを計画する

より良い Gemini Omni Flash プロンプトを作成する

上記のプロンプトスタジオを使用して、創造的なアイデアをテキストからビデオへの変換、参照ベースのビデオ、または会話形式の編集のための構造化されたブリーフに変換します。

Gemini オムニフラッシュから始める Googleの発表を読む

テキスト、画像、ビデオ、オーディオのリファレンス

自然言語のマルチターン編集

Google の公式サンプルメディア

SynthID 透明性に関するメモ

Gemini オムニフラッシュに関するよくある質問

Gemini Omni Flash スタジオ

Gemini Omni Flash AI 動画生成

作成および編集用に構築された Gemini ビデオ モデル

あらゆる入力ビデオ

会話形式の編集

SynthID 透明度

Gemini Omni Flash overview

AI動画制作の新たなワークフロー

テキストからビデオへ

自然言語編集

マルチモーダルリファレンス

世界の知識と物理学

ビデオの作成、編集、再参照

テキストからビデオへの概念

自然言語ビデオ編集

リファレンスベースの制作

Gemini オムニ Flash ビデオの例

複雑なテキスト プロンプト モンタージュ

リキッドミラー編集

マルチターンヴァイオリン編集

物理連鎖反応

画像 + ビデオ + オーディオ リファレンス

リアルな映像を描画

Gemini Omni Flash プロンプトを改善するための 3 つのステップ

ソース入力を選択します

動きと拘束について説明する

会話形式で反復する

Geminiの世界知識の地上ビデオ

透明性シグナルを考慮した設計

さらにクリエイティブな AI ツールを探索する

Veo 4 AI ビデオ ジェネレーター

Gemini Flash画像編集

AI Image Editor

クリエイションギャラリー

より良い Gemini Omni Flash プロンプトを作成する

よくある質問

Gemini オムニフラッシュとは何ですか?

Gemini Omni Flash はどのような入力をサポートしていますか?

マルチターンビデオ編集は可能ですか?

Gemini Omni Flash は物理学を理解していますか?

Gemini Omni Flash はどこで試せますか?

このページのビデオはこのサイトによって生成されたものですか?

作成および編集用に構築された Gemini ビデオモデル

複雑なテキストプロンプトモンタージュ

画像 + ビデオ + オーディオリファレンス

Veo 4 AI ビデオジェネレーター