Skip to content

Gemini Omni Flash スタジオ

Google の Gemini Omni モデルにインスピレーションを得た、マルチモーダル ビデオ生成と自然言語ビデオ編集のためのドラフト プロンプト。

Model
Gemini Omni Flash model preview
Gemini Omni FlashPreview

Multimodal video generation and editing

作成タイプ

被写体、モーション、カメラ、オーディオ、参照入力、および保持する制約を使用する場合に最適です。

公式 Gemini オムニの例

Google の発表の参考クリップでは、テキストからビデオへの作成、自然言語編集、マルチモーダル参照、根拠のある物理学が示されています。

Gemini Omni Flash 公式ヒーロー アートワーク
Gemini Omni Flash アルファベット モンタージュ ビデオ フレーム
Gemini Omni Flash 公式ヒーロー アートワーク
Gemini Omni Flash アルファベット モンタージュ ビデオ フレーム
ドラッグして比較

複雑なテキスト プロンプトから生成されたアルファベットのモンタージュ。

Gemini Omni Flash AI 動画生成

Gemini Omni Flash は、Google の最初の Gemini Omni モデルです。テキスト、画像、ビデオ、オーディオ参照からクリップを作成し、会話型編集でそれらを調整するためのマルチモーダル ビデオ システムです。

Gemini Omni Flash プロンプトを試してください
Gemini Omni Flash official announcement artwork
Gemini オムニフラッシュとは何ですか?

作成および編集用に構築された Gemini ビデオ モデル

Gemini Omni Flash は、Google の Gemini Omni ファミリーの最初のモデルです。 Google は、テキスト、画像、ビデオ、音声参照などのあらゆる入力から何かを作成し、自然な会話言語で編集を続ける方法としてこれを提示しています。

このモデルは、ワンショット生成以上のものを想定して設計されています。公式の例では、マルチターン編集、スタイルの変更、モーション転送、マテリアルの変換、カメラ アングルの変更、オーディオを意識したビジュアル タイミングが示されています。

クリエーターやチームにとって、実際的な価値は反復の高速化です。プロンプトまたはリファレンスから開始し、わかりやすい言葉で具体的な編集を行い、モーション、スタイル、サウンド、ストーリー全体でクリップの一貫性を保ちます。

あらゆる入力ビデオ

テキスト、画像、ビデオ参照、サポートされている音声入力からビデオを構築します。

会話形式の編集

主題、タイミング、動きを維持しながら、自然言語を反復処理します。

SynthID 透明度

Google によると、すべての Omni 動画には、目に見えない SynthID ウォーターマークが含まれています。

Gemini Omni Flash multimodal video model overview

Gemini Omni Flash overview

Create from references, edit by conversation, and preserve coherent motion.

Gemini Omni Flash が重要な理由

AI動画制作の新たなワークフロー

Gemini Omni Flash は、生成、編集、リファレンスの理解、世界の知識を 1 つのビデオ ワークフローに統合します。

テキストからビデオへ

コンパクトなプロンプトを映画のようなクリップ、説明、モーション スタディ、ソーシャル対応シーンに変換します。

ビデオへのプロンプト映画のような動き短編クリップ

自然言語編集

新しいマテリアル、変更された環境、目に見えないオブジェクト、新しいカメラ アングルなどの編集を依頼してください。

マルチターン編集平易な言葉反復の高速化

マルチモーダルリファレンス

画像、ビデオ、テキスト、サポートされている音声リファレンスを 1 つのまとまりのある出力にブレンドします。

画像参照モーション転送オーディオのタイミング

世界の知識と物理学

Gemini の知識と改善された物理的推論を使用して、より有意義で信頼できるシーンを実現します。

gravity流体力学視覚的な説明者

ビデオの作成、編集、再参照

Gemini Omni Flash は、Google が強調したワークフロー (テキスト作成、反復編集、参照主導の構成) に使用します。

テキストからビデオへの概念

テキストからビデオへの概念

コンパクトなクリエイティブ ブリーフから開始して、モーション、カメラ言語、サウンドの方向を含むクリップを生成します。

自然言語ビデオ編集

自然言語ビデオ編集

手動のタイムライン作業を行わずに、マテリアルの変更、オブジェクトの削除、カメラ アングルの変更、またはシーンのスタイルの変更を行うことができます。

リファレンスベースの制作

リファレンスベースの制作

アイデンティティ、モーション、スタイル、オーディオのタイミングにリファレンス メディアを使用し、それらを 1 つの出力にブレンドします。

公式参照メディア

Gemini オムニ Flash ビデオの例

これらのクリップは、Google の Gemini Omni 発表のメディアを参照しており、記事で示されている生成および編集ワークフローの種類を示すために含まれています。

出典: Google ブログ

複雑なテキスト プロンプト モンタージュ

アルファベットのシーケンスでは、1 つの詳細なプロンプトからの素早いオブジェクトの変化、ローワーサード、および音楽が使用されます。

Create an alphabet montage with unusual objects, matching lower thirds, and calm music.

リキッドミラー編集

自然言語編集により、鏡が波打つ液体に変わり、腕が反射素材に変わります。

Make the mirror ripple beautifully like liquid and make the arm reflective.

マルチターンヴァイオリン編集

この記事では、表示されている楽器を削除するなど、複数の編集にわたって同じバイオリン クリップを変更する方法を示します。

Make the violin invisible while keeping the performance coherent.

物理連鎖反応

ビー玉が連続的な動きと音声とともに連鎖反応トラックを転がります。

A marble rolling fast on a chain reaction style track, continuous smooth shot.

画像 + ビデオ + オーディオ リファレンス

SF クリップは、画像、ビデオ、オーディオのリファレンスを 1 つの同期された出力に結合します。

Use image, motion video, and audio timing references to create a dynamic sci-fi clip.

リアルな映像を描画

描画によってモーションがガイドされ、最終出力はリアルな映像になります。

Turn the drawing into realistic footage while using it only as a guide for movement.

オムニプロンプトを計画する方法

Gemini Omni Flash プロンプトを改善するための 3 つのステップ

このモデルは、明確な意図、具体的な参照の役割、編集中に安定すべきものについての明示的な指示を与えます。

Gemini Omni Flash step 1 source inputs
1

ソース入力を選択します

クリップがテキスト、画像、ビデオ、オーディオ、または参照の組み合わせのいずれから始まるかを決定します。

Gemini Omni Flash step 2 natural language edit
2

動きと拘束について説明する

Gemini Omni Flash が保持する必要がある被写体、動き、カメラ パス、スタイル、オーディオ タイミング、および詳細に名前を付けます。

Gemini Omni Flash step 3 multi-turn edit
3

会話形式で反復する

マテリアルの変更、カメラアングルの変更、スタイルの転送、オブジェクトの削除などの正確な編集をフォローアップします。

Gemini Omni Flash physics and world knowledge example

Geminiの世界知識の地上ビデオ

Google は、Omni を、物理学、科学、歴史、文化的背景に関する Gemini の知識とビジュアル生成を組み合わせたものだと説明しています。これにより、クリップは視覚的にもっともらしいものになるだけでなく、より明確な意味を伝え、複雑なアイデアをより適切に説明できるようになります。

Gemini Omni Flash transparency and reference motion example

透明性シグナルを考慮した設計

公式発表によると、すべての Omni ビデオには Google の知覚できない SynthID 電子透かしが含まれており、Gemini アプリ サーフェス、Chrome の Gemini、Google 検索による検証サポートが提供されています。

次のオムニ スタイルのビデオを計画する

より良い Gemini Omni Flash プロンプトを作成する

上記のプロンプト スタジオを使用して、創造的なアイデアをテキストからビデオへの変換、参照ベースのビデオ、または会話形式の編集のための構造化されたブリーフに変換します。

テキスト、画像、ビデオ、オーディオのリファレンス
自然言語のマルチターン編集
Google の公式サンプル メディア
SynthID 透明性に関するメモ
Gemini オムニ フラッシュに関するよくある質問

よくある質問