Gemini Omni Flash 工作室
受 Google Gemini Omni 模型启发,多模式视频生成和自然语言视频编辑的草稿提示。
Multimodal video generation and editing
最适合拍摄对象、运动、摄像机、音频、参考输入和要保留的约束。
官方 Gemini Omni 示例
谷歌公告中的参考剪辑显示了文本到视频的创建、自然语言编辑、多模式参考和基础物理。


从复杂的文本提示生成的字母蒙太奇。
Gemini Omni Flash AI 视频生成器
Gemini Omni Flash 是 Google 的首款 Gemini Omni 型号:一种多模式视频系统,用于根据文本、图像、视频和音频参考创建剪辑,然后通过对话式编辑对其进行优化。
尝试 Gemini Omni Flash 提示
专为创建和编辑而构建的 Gemini 视频模型
Gemini Omni Flash 是 Google Gemini Omni 系列中的首款型号。谷歌将其描述为一种从任何输入(包括文本、图像、视频和语音参考)创建任何内容的方法,然后继续使用自然对话语言进行编辑。
该模型专为多次生成而设计。官方示例展示了多轮编辑、风格变化、动作转移、材质变换、摄像机角度变化和音频感知视觉计时。
对于创作者和团队来说,实际价值是更快的迭代:从提示或参考开始,用简单的语言进行特定的编辑,并保持剪辑在动作、风格、声音和故事方面的连贯性。
任意输入视频
从文本、图像、视频参考和支持的语音输入构建视频。
对话编辑
使用自然语言进行迭代,同时保留主题、时间和动作。
SynthID 透明度
谷歌表示,所有 Omni 视频都包含难以察觉的 SynthID 水印。

Gemini Omni Flash overview
Create from references, edit by conversation, and preserve coherent motion.
AI 视频创作的新工作流程
Gemini Omni Flash 将生成、编辑、参考理解和世界知识结合在一个视频工作流程中。
文字转视频
将紧凑的提示变成电影剪辑、解释器、动作研究和社交场景。
自然语言编辑
要求进行编辑,例如新材料、改变的环境、看不见的物体或新的摄像机角度。
多式联运参考文献
将图像、视频、文本和支持的语音参考混合成一个有凝聚力的输出。
世界知识与物理
使用 Gemini 的知识和改进的物理推理来获得更有意义和可信的场景。
创建、编辑和重新引用视频
使用 Gemini Omni Flash 实现 Google 强调的工作流程:文本创建、迭代编辑和参考驱动的合成。

文本到视频的构思
从紧凑的创意简介开始,生成包含动作、摄像机语言和声音方向的剪辑。

自然语言视频编辑
无需手动时间轴工作即可更改材质、移除对象、改变摄像机角度或重新设计场景。

基于参考的生产
使用参考媒体来确定身份、动作、风格和音频定时,然后将它们混合到单个输出中。
复杂的文本提示蒙太奇
字母序列使用快速的对象变化、下三分之一和来自一个详细提示的音乐。
Create an alphabet montage with unusual objects, matching lower thirds, and calm music.
液体镜 编辑
自然语言编辑将镜子变成涟漪液体,将手臂变成反光材料。
Make the mirror ripple beautifully like liquid and make the arm reflective.
多转小提琴 编辑
本文演示了如何通过多次编辑来更改同一小提琴片段,包括删除可见的乐器。
Make the violin invisible while keeping the performance coherent.
物理连锁反应
弹珠在连锁反应轨道上滚动,伴随着连续的运动和声音。
A marble rolling fast on a chain reaction style track, continuous smooth shot.
图片+视频+音频参考
科幻剪辑将图像、视频和音频参考组合到一个同步输出中。
Use image, motion video, and audio timing references to create a dynamic sci-fi clip.
绘制逼真的镜头
绘图引导运动,而最终输出成为逼真的镜头。
Turn the drawing into realistic footage while using it only as a guide for movement.
改善 Gemini Omni Flash 提示的三个步骤
该模型奖励明确的意图、具体的参考角色以及在编辑过程中应保持稳定的明确指示。

选择源输入
决定剪辑是从文本、图像、视频、音频还是参考组合开始。

描述运动和约束
命名 Gemini Omni Flash 应保留的主题、运动、摄像机路径、风格、音频时序和细节。

对话式迭代
进行精确的编辑,例如材质更改、相机角度更改、风格转换或对象移除。

Gemini世界知识中的地面视频
Google 将 Omni 描述为将视觉生成与 Gemini 的物理、科学、历史和文化背景知识相结合。这有助于剪辑变得不仅在视觉上合理:它们可以承载更清晰的含义并更好地解释复杂的想法。

设计有透明信号
官方公告称,所有 Omni 视频均包含 Google 不易察觉的 SynthID 数字水印,并通过 Gemini 应用程序界面、Chrome 中的 Gemini 和 Google 搜索提供验证支持。
探索更多创意人工智能工具
将全方位风格的视频规划与图像生成、编辑和其他媒体工作流程结合起来。
编写更好的 Gemini Omni Flash 提示
使用上面的提示工作室将创意转化为结构化简报,用于文本转视频、参考驱动视频或对话式编辑。

