Skip to content

Gemini Omni Flash 工作室

受 Google Gemini Omni 模型启发,多模式视频生成和自然语言视频编辑的草稿提示。

Model
Gemini Omni Flash model preview
Gemini Omni FlashPreview

Multimodal video generation and editing

创作类型

最适合拍摄对象、运动、摄像机、音频、参考输入和要保留的约束。

官方 Gemini Omni 示例

谷歌公告中的参考剪辑显示了文本到视频的创建、自然语言编辑、多模式参考和基础物理。

Gemini Omni Flash 官方英雄艺术作品
Gemini Omni Flash 字母蒙太奇视频框架
Gemini Omni Flash 官方英雄艺术作品
Gemini Omni Flash 字母蒙太奇视频框架
拖动对比

从复杂的文本提示生成的字母蒙太奇。

Gemini Omni Flash AI 视频生成器

Gemini Omni Flash 是 Google 的首款 Gemini Omni 型号:一种多模式视频系统,用于根据文本、图像、视频和音频参考创建剪辑,然后通过对话式编辑对其进行优化。

尝试 Gemini Omni Flash 提示
Gemini Omni Flash official announcement artwork
什么是 Gemini Omni 闪存?

专为创建和编辑而构建的 Gemini 视频模型

Gemini Omni Flash 是 Google Gemini Omni 系列中的首款型号。谷歌将其描述为一种从任何输入(包括文本、图像、视频和语音参考)创建任何内容的方法,然后继续使用自然对话语言进行编辑。

该模型专为多次生成而设计。官方示例展示了多轮编辑、风格变化、动作转移、材质变换、摄像机角度变化和音频感知视觉计时。

对于创作者和团队来说,实际价值是更快的迭代:从提示或参考开始,用简单的语言进行特定的编辑,并保持剪辑在动作、风格、声音和故事方面的连贯性。

任意输入视频

从文本、图像、视频参考和支持的语音输入构建视频。

对话编辑

使用自然语言进行迭代,同时保留主题、时间和动作。

SynthID 透明度

谷歌表示,所有 Omni 视频都包含难以察觉的 SynthID 水印。

Gemini Omni Flash multimodal video model overview

Gemini Omni Flash overview

Create from references, edit by conversation, and preserve coherent motion.

为什么 Gemini Omni Flash 很重要

AI 视频创作的新工作流程

Gemini Omni Flash 将生成、编辑、参考理解和世界知识结合在一个视频工作流程中。

文字转视频

将紧凑的提示变成电影剪辑、解释器、动作研究和社交场景。

提示视频电影动作短片

自然语言编辑

要求进行编辑,例如新材料、改变的环境、看不见的物体或新的摄像机角度。

多轮编辑通俗易懂的语言更快的迭代

多式联运参考文献

将图像、视频、文本和支持的语音参考混合成一个有凝聚力的输出。

图片参考运动转移音频计时

世界知识与物理

使用 Gemini 的知识和改进的物理推理来获得更有意义和可信的场景。

gravity流体动力学视觉解释器

创建、编辑和重新引用视频

使用 Gemini Omni Flash 实现 Google 强调的工作流程:文本创建、迭代编辑和参考驱动的合成。

文本到视频的构思

文本到视频的构思

从紧凑的创意简介开始,生成包含动作、摄像机语言和声音方向的剪辑。

自然语言视频编辑

自然语言视频编辑

无需手动时间轴工作即可更改材质、移除对象、改变摄像机角度或重新设计场景。

基于参考的生产

基于参考的生产

使用参考媒体来确定身份、动作、风格和音频定时,然后将它们混合到单个输出中。

官方参考媒体

Gemini Omni Flash 视频示例

这些剪辑引用了 Google 的 Gemini Omni 公告中的媒体,并用于展示本文演示的生成和编辑工作流程的类型。

来源:谷歌博客

复杂的文本提示蒙太奇

字母序列使用快速的对象变化、下三分之一和来自一个详细提示的音乐。

Create an alphabet montage with unusual objects, matching lower thirds, and calm music.

液体镜 编辑

自然语言编辑将镜子变成涟漪液体,将手臂变成反光材料。

Make the mirror ripple beautifully like liquid and make the arm reflective.

多转小提琴 编辑

本文演示了如何通过多次编辑来更改同一小提琴片段,包括删除可见的乐器。

Make the violin invisible while keeping the performance coherent.

物理连锁反应

弹珠在连锁反应轨道上滚动,伴随着连续的运动和声音。

A marble rolling fast on a chain reaction style track, continuous smooth shot.

图片+视频+音频参考

科幻剪辑将图像、视频和音频参考组合到一个同步输出中。

Use image, motion video, and audio timing references to create a dynamic sci-fi clip.

绘制逼真的镜头

绘图引导运动,而最终输出成为逼真的镜头。

Turn the drawing into realistic footage while using it only as a guide for movement.

如何规划 Omni 提示

改善 Gemini Omni Flash 提示的三个步骤

该模型奖励明确的意图、具体的参考角色以及在编辑过程中应保持稳定的明确指示。

Gemini Omni Flash step 1 source inputs
1

选择源输入

决定剪辑是从文本、图像、视频、音频还是参考组合开始。

Gemini Omni Flash step 2 natural language edit
2

描述运动和约束

命名 Gemini Omni Flash 应保留的主题、运动、摄像机路径、风格、音频时序和细节。

Gemini Omni Flash step 3 multi-turn edit
3

对话式迭代

进行精确的编辑,例如材质更改、相机角度更改、风格转换或对象移除。

Gemini Omni Flash physics and world knowledge example

Gemini世界知识中的地面视频

Google 将 Omni 描述为将视觉生成与 Gemini 的物理、科学、历史和文化背景知识相结合。这有助于剪辑变得不仅在视觉上合理:它们可以承载更清晰的含义并更好地解释复杂的想法。

Gemini Omni Flash transparency and reference motion example

设计有透明信号

官方公告称,所有 Omni 视频均包含 Google 不易察觉的 SynthID 数字水印,并通过 Gemini 应用程序界面、Chrome 中的 Gemini 和 Google 搜索提供验证支持。

规划您的下一个 Omni 风格视频

编写更好的 Gemini Omni Flash 提示

使用上面的提示工作室将创意转化为结构化简报,用于文本转视频、参考驱动视频或对话式编辑。

文本、图像、视频和音频参考
自然语言多轮编辑
Google 官方示例媒体
SynthID 透明说明
Gemini Omni Flash 常见问题解答

常见问题解答