Gemini Omni Flash スタジオ
Google の Gemini Omni モデルにインスピレーションを得た、マルチモーダル ビデオ生成と自然言語ビデオ編集のためのドラフト プロンプト。
Multimodal video generation and editing
被写体、モーション、カメラ、オーディオ、参照入力、および保持する制約を使用する場合に最適です。
公式 Gemini オムニの例
Google の発表の参考クリップでは、テキストからビデオへの作成、自然言語編集、マルチモーダル参照、根拠のある物理学が示されています。


複雑なテキスト プロンプトから生成されたアルファベットのモンタージュ。
Gemini Omni Flash AI 動画生成
Gemini Omni Flash は、Google の最初の Gemini Omni モデルです。テキスト、画像、ビデオ、オーディオ参照からクリップを作成し、会話型編集でそれらを調整するためのマルチモーダル ビデオ システムです。
Gemini Omni Flash プロンプトを試してください
作成および編集用に構築された Gemini ビデオ モデル
Gemini Omni Flash は、Google の Gemini Omni ファミリーの最初のモデルです。 Google は、テキスト、画像、ビデオ、音声参照などのあらゆる入力から何かを作成し、自然な会話言語で編集を続ける方法としてこれを提示しています。
このモデルは、ワンショット生成以上のものを想定して設計されています。公式の例では、マルチターン編集、スタイルの変更、モーション転送、マテリアルの変換、カメラ アングルの変更、オーディオを意識したビジュアル タイミングが示されています。
クリエーターやチームにとって、実際的な価値は反復の高速化です。プロンプトまたはリファレンスから開始し、わかりやすい言葉で具体的な編集を行い、モーション、スタイル、サウンド、ストーリー全体でクリップの一貫性を保ちます。
あらゆる入力ビデオ
テキスト、画像、ビデオ参照、サポートされている音声入力からビデオを構築します。
会話形式の編集
主題、タイミング、動きを維持しながら、自然言語を反復処理します。
SynthID 透明度
Google によると、すべての Omni 動画には、目に見えない SynthID ウォーターマークが含まれています。

Gemini Omni Flash overview
Create from references, edit by conversation, and preserve coherent motion.
AI動画制作の新たなワークフロー
Gemini Omni Flash は、生成、編集、リファレンスの理解、世界の知識を 1 つのビデオ ワークフローに統合します。
テキストからビデオへ
コンパクトなプロンプトを映画のようなクリップ、説明、モーション スタディ、ソーシャル対応シーンに変換します。
自然言語編集
新しいマテリアル、変更された環境、目に見えないオブジェクト、新しいカメラ アングルなどの編集を依頼してください。
マルチモーダルリファレンス
画像、ビデオ、テキスト、サポートされている音声リファレンスを 1 つのまとまりのある出力にブレンドします。
世界の知識と物理学
Gemini の知識と改善された物理的推論を使用して、より有意義で信頼できるシーンを実現します。
ビデオの作成、編集、再参照
Gemini Omni Flash は、Google が強調したワークフロー (テキスト作成、反復編集、参照主導の構成) に使用します。

テキストからビデオへの概念
コンパクトなクリエイティブ ブリーフから開始して、モーション、カメラ言語、サウンドの方向を含むクリップを生成します。

自然言語ビデオ編集
手動のタイムライン作業を行わずに、マテリアルの変更、オブジェクトの削除、カメラ アングルの変更、またはシーンのスタイルの変更を行うことができます。

リファレンスベースの制作
アイデンティティ、モーション、スタイル、オーディオのタイミングにリファレンス メディアを使用し、それらを 1 つの出力にブレンドします。
Gemini オムニ Flash ビデオの例
これらのクリップは、Google の Gemini Omni 発表のメディアを参照しており、記事で示されている生成および編集ワークフローの種類を示すために含まれています。
出典: Google ブログ複雑なテキスト プロンプト モンタージュ
アルファベットのシーケンスでは、1 つの詳細なプロンプトからの素早いオブジェクトの変化、ローワーサード、および音楽が使用されます。
Create an alphabet montage with unusual objects, matching lower thirds, and calm music.
リキッドミラー編集
自然言語編集により、鏡が波打つ液体に変わり、腕が反射素材に変わります。
Make the mirror ripple beautifully like liquid and make the arm reflective.
マルチターンヴァイオリン編集
この記事では、表示されている楽器を削除するなど、複数の編集にわたって同じバイオリン クリップを変更する方法を示します。
Make the violin invisible while keeping the performance coherent.
物理連鎖反応
ビー玉が連続的な動きと音声とともに連鎖反応トラックを転がります。
A marble rolling fast on a chain reaction style track, continuous smooth shot.
画像 + ビデオ + オーディオ リファレンス
SF クリップは、画像、ビデオ、オーディオのリファレンスを 1 つの同期された出力に結合します。
Use image, motion video, and audio timing references to create a dynamic sci-fi clip.
リアルな映像を描画
描画によってモーションがガイドされ、最終出力はリアルな映像になります。
Turn the drawing into realistic footage while using it only as a guide for movement.
Gemini Omni Flash プロンプトを改善するための 3 つのステップ
このモデルは、明確な意図、具体的な参照の役割、編集中に安定すべきものについての明示的な指示を与えます。

ソース入力を選択します
クリップがテキスト、画像、ビデオ、オーディオ、または参照の組み合わせのいずれから始まるかを決定します。

動きと拘束について説明する
Gemini Omni Flash が保持する必要がある被写体、動き、カメラ パス、スタイル、オーディオ タイミング、および詳細に名前を付けます。

会話形式で反復する
マテリアルの変更、カメラアングルの変更、スタイルの転送、オブジェクトの削除などの正確な編集をフォローアップします。

Geminiの世界知識の地上ビデオ
Google は、Omni を、物理学、科学、歴史、文化的背景に関する Gemini の知識とビジュアル生成を組み合わせたものだと説明しています。これにより、クリップは視覚的にもっともらしいものになるだけでなく、より明確な意味を伝え、複雑なアイデアをより適切に説明できるようになります。

透明性シグナルを考慮した設計
公式発表によると、すべての Omni ビデオには Google の知覚できない SynthID 電子透かしが含まれており、Gemini アプリ サーフェス、Chrome の Gemini、Google 検索による検証サポートが提供されています。
さらにクリエイティブな AI ツールを探索する
オムニ スタイルのビデオ プランニングと画像の生成、編集、その他のメディア ワークフローを組み合わせます。
より良い Gemini Omni Flash プロンプトを作成する
上記のプロンプト スタジオを使用して、創造的なアイデアをテキストからビデオへの変換、参照ベースのビデオ、または会話形式の編集のための構造化されたブリーフに変換します。

