Estúdio Gemini Omni Flash
Rascunhos de solicitações para geração de vídeo multimodal e edições de vídeo em linguagem natural inspiradas no modelo Gemini Omni do Google.
Multimodal video generation and editing
Funciona melhor com assunto, movimento, câmera, áudio, entradas de referência e restrições a serem preservadas.
Exemplos oficiais do Gemini Omni
Os clipes de referência do anúncio do Google mostram a criação de texto para vídeo, edições de linguagem natural, referências multimodais e física fundamentada.


Montagem do alfabeto gerada a partir de um prompt de texto complexo.
Gerador de vídeo IA Gemini Omni Flash
Gemini Omni Flash é o primeiro modelo Gemini Omni do Google: um sistema de vídeo multimodal para criar clipes a partir de referências de texto, imagens, vídeo e áudio e, em seguida, refiná-los com edições de conversação.
Experimente os prompts Gemini Omni Flash
Um modelo de vídeo Gemini desenvolvido para criação e edição
Gemini Omni Flash é o primeiro modelo da família Gemini Omni do Google. O Google apresenta-o como uma forma de criar qualquer coisa a partir de qualquer entrada, incluindo texto, imagem, vídeo e referências de voz, e depois continuar editando com linguagem de conversação natural.
O modelo foi projetado para mais de uma geração única. Os exemplos oficiais mostram edição multivoltas, mudanças de estilo, transferência de movimento, transformações de materiais, mudanças de ângulo de câmera e temporização visual com reconhecimento de áudio.
Para criadores e equipes, o valor prático é uma iteração mais rápida: comece com um prompt ou referência, faça edições específicas em linguagem simples e mantenha o clipe coerente em termos de movimento, estilo, som e história.
Vídeo com qualquer entrada
Crie vídeos a partir de texto, imagens, referências de vídeo e entrada de voz compatível.
Edições de conversação
Itere com linguagem natural preservando o assunto, o tempo e o movimento.
Transparência SynthID
O Google diz que todos os vídeos Omni incluem sua marca d'água imperceptível SynthID.

Gemini Omni Flash overview
Create from references, edit by conversation, and preserve coherent motion.
Um novo fluxo de trabalho para criação de vídeos com IA
Gemini Omni Flash combina geração, edição, compreensão de referência e conhecimento mundial em um fluxo de trabalho de vídeo.
Texto para vídeo
Transforme prompts compactos em clipes cinematográficos, explicadores, estudos de movimento e cenas sociais.
Edição de linguagem natural
Peça edições como novos materiais, ambientes alterados, objetos invisíveis ou novos ângulos de câmera.
Referências multimodais
Combine imagens, vídeos, texto e referências de voz compatíveis em uma saída coesa.
Conhecimento Mundial e Física
Use o conhecimento do Gemini e o raciocínio físico aprimorado para cenas mais significativas e verossímeis.
Crie, edite e referencie novamente o vídeo
Use Gemini Omni Flash para os fluxos de trabalho destacados pelo Google: criação de texto, edição iterativa e composição orientada por referência.

Concepção de texto para vídeo
Comece com um resumo criativo compacto e gere um clipe com movimento, linguagem de câmera e direção de som.

Edições de vídeo em linguagem natural
Altere materiais, remova objetos, altere ângulos de câmera ou reestilize uma cena sem trabalho manual na linha do tempo.

Produção baseada em referência
Use mídia de referência para identidade, movimento, estilo e tempo de áudio e, em seguida, combine-os em uma única saída.
Exemplos de vídeo Omni Flash Gemini
Esses clipes fazem referência à mídia do anúncio Gemini Omni do Google e são incluídos para mostrar os tipos de fluxos de trabalho de geração e edição que o artigo demonstra.
Fonte: Blog do GoogleMontagem de prompt de texto complexo
Uma sequência alfabética usa mudanças rápidas de objetos, terços inferiores e música a partir de um prompt detalhado.
Create an alphabet montage with unusual objects, matching lower thirds, and calm music.
Edição de espelho líquido
Uma edição em linguagem natural transforma um espelho em um líquido ondulante e um braço em material reflexivo.
Make the mirror ripple beautifully like liquid and make the arm reflective.
Edição de violino multivoltas
O artigo demonstra a alteração do mesmo clipe de violino em várias edições, incluindo a remoção do instrumento visível.
Make the violin invisible while keeping the performance coherent.
Reação em Cadeia da Física
Uma bola de gude rola por uma trilha de reação em cadeia com movimento e áudio contínuos.
A marble rolling fast on a chain reaction style track, continuous smooth shot.
Imagem + Vídeo + Referência de Áudio
Um clipe de ficção científica combina referências de imagem, vídeo e áudio em uma saída sincronizada.
Use image, motion video, and audio timing references to create a dynamic sci-fi clip.
Desenhando para filmagens realistas
Um desenho orienta o movimento enquanto o resultado final se torna uma filmagem realista.
Turn the drawing into realistic footage while using it only as a guide for movement.
Três etapas para melhorar os prompts Gemini Omni Flash
O modelo recompensa intenções claras, funções de referência concretas e instruções explícitas sobre o que deve permanecer estável durante as edições.

Escolha as entradas de origem
Decida se o clipe começa com texto, imagem, vídeo, áudio ou uma combinação de referências.

Descrever movimento e restrições
Nomeie o assunto, movimento, caminho da câmera, estilo, tempo de áudio e detalhes que o Gemini Omni Flash deve preservar.

Iterar conversacionalmente
Acompanhe com edições precisas, como alterações de materiais, alterações de ângulo de câmera, transferência de estilo ou remoção de objetos.

Vídeo de base no conhecimento mundial do Gemini
O Google descreve Omni como uma combinação de geração visual com o conhecimento de física, ciência, história e contexto cultural do Gemini. Isso ajuda os clipes a se tornarem mais do que visualmente plausíveis: eles podem ter um significado mais claro e explicar melhor ideias complexas.

Projetado com sinais de transparência
O anúncio oficial diz que todos os vídeos Omni incluem a marca d'água digital SynthID imperceptível do Google, com suporte de verificação por meio de superfícies de aplicativos Gemini, Gemini no Chrome e Pesquisa Google.
Explore mais ferramentas criativas de IA
Combine o planejamento de vídeo estilo Omni com geração de imagens, edição e outros fluxos de trabalho de mídia.

Gerador de vídeo Veo 4 AI
Crie clipes de texto para vídeo e de imagem para vídeo em um fluxo de trabalho que prioriza o vídeo.

Edição de imagem flash Gemini
Edite imagens com fluxos de trabalho de prompt no estilo Gemini Flash.

AI Image Editor
Use a edição baseada em prompt para transformações diárias de imagens.

Galeria de Criação
Navegue por imagens e vídeos criativos do amplo estúdio de IA.
Escreva um prompt Gemini Omni Flash melhor
Use o prompt studio acima para transformar uma ideia criativa em um briefing estruturado para conversão de texto em vídeo, vídeo baseado em referência ou edição de conversação.