Skip to content

Estúdio Gemini Omni Flash

Rascunhos de solicitações para geração de vídeo multimodal e edições de vídeo em linguagem natural inspiradas no modelo Gemini Omni do Google.

Model
Gemini Omni Flash model preview
Gemini Omni FlashPreview

Multimodal video generation and editing

Tipo de criação

Funciona melhor com assunto, movimento, câmera, áudio, entradas de referência e restrições a serem preservadas.

Exemplos oficiais do Gemini Omni

Os clipes de referência do anúncio do Google mostram a criação de texto para vídeo, edições de linguagem natural, referências multimodais e física fundamentada.

Arte oficial do herói Gemini Omni Flash
Quadro de vídeo de montagem do alfabeto Gemini Omni Flash
Arte oficial do herói Gemini Omni Flash
Quadro de vídeo de montagem do alfabeto Gemini Omni Flash
Arraste para comparar

Montagem do alfabeto gerada a partir de um prompt de texto complexo.

Gerador de vídeo IA Gemini Omni Flash

Gemini Omni Flash é o primeiro modelo Gemini Omni do Google: um sistema de vídeo multimodal para criar clipes a partir de referências de texto, imagens, vídeo e áudio e, em seguida, refiná-los com edições de conversação.

Experimente os prompts Gemini Omni Flash
Gemini Omni Flash official announcement artwork
O que é Gemini Omni Flash?

Um modelo de vídeo Gemini desenvolvido para criação e edição

Gemini Omni Flash é o primeiro modelo da família Gemini Omni do Google. O Google apresenta-o como uma forma de criar qualquer coisa a partir de qualquer entrada, incluindo texto, imagem, vídeo e referências de voz, e depois continuar editando com linguagem de conversação natural.

O modelo foi projetado para mais de uma geração única. Os exemplos oficiais mostram edição multivoltas, mudanças de estilo, transferência de movimento, transformações de materiais, mudanças de ângulo de câmera e temporização visual com reconhecimento de áudio.

Para criadores e equipes, o valor prático é uma iteração mais rápida: comece com um prompt ou referência, faça edições específicas em linguagem simples e mantenha o clipe coerente em termos de movimento, estilo, som e história.

Vídeo com qualquer entrada

Crie vídeos a partir de texto, imagens, referências de vídeo e entrada de voz compatível.

Edições de conversação

Itere com linguagem natural preservando o assunto, o tempo e o movimento.

Transparência SynthID

O Google diz que todos os vídeos Omni incluem sua marca d'água imperceptível SynthID.

Gemini Omni Flash multimodal video model overview

Gemini Omni Flash overview

Create from references, edit by conversation, and preserve coherent motion.

Por que o Gemini Omni Flash é importante

Um novo fluxo de trabalho para criação de vídeos com IA

Gemini Omni Flash combina geração, edição, compreensão de referência e conhecimento mundial em um fluxo de trabalho de vídeo.

Texto para vídeo

Transforme prompts compactos em clipes cinematográficos, explicadores, estudos de movimento e cenas sociais.

solicitar vídeomovimento cinematográficoclipes curtos

Edição de linguagem natural

Peça edições como novos materiais, ambientes alterados, objetos invisíveis ou novos ângulos de câmera.

edições multivoltaslinguagem simplesiteração mais rápida

Referências multimodais

Combine imagens, vídeos, texto e referências de voz compatíveis em uma saída coesa.

referência de imagemtransferência de movimentotempo de áudio

Conhecimento Mundial e Física

Use o conhecimento do Gemini e o raciocínio físico aprimorado para cenas mais significativas e verossímeis.

gravitydinâmica de fluidosexplicadores visuais

Crie, edite e referencie novamente o vídeo

Use Gemini Omni Flash para os fluxos de trabalho destacados pelo Google: criação de texto, edição iterativa e composição orientada por referência.

Concepção de texto para vídeo

Concepção de texto para vídeo

Comece com um resumo criativo compacto e gere um clipe com movimento, linguagem de câmera e direção de som.

Edições de vídeo em linguagem natural

Edições de vídeo em linguagem natural

Altere materiais, remova objetos, altere ângulos de câmera ou reestilize uma cena sem trabalho manual na linha do tempo.

Produção baseada em referência

Produção baseada em referência

Use mídia de referência para identidade, movimento, estilo e tempo de áudio e, em seguida, combine-os em uma única saída.

Mídia oficial de referência

Exemplos de vídeo Omni Flash Gemini

Esses clipes fazem referência à mídia do anúncio Gemini Omni do Google e são incluídos para mostrar os tipos de fluxos de trabalho de geração e edição que o artigo demonstra.

Fonte: Blog do Google

Montagem de prompt de texto complexo

Uma sequência alfabética usa mudanças rápidas de objetos, terços inferiores e música a partir de um prompt detalhado.

Create an alphabet montage with unusual objects, matching lower thirds, and calm music.

Edição de espelho líquido

Uma edição em linguagem natural transforma um espelho em um líquido ondulante e um braço em material reflexivo.

Make the mirror ripple beautifully like liquid and make the arm reflective.

Edição de violino multivoltas

O artigo demonstra a alteração do mesmo clipe de violino em várias edições, incluindo a remoção do instrumento visível.

Make the violin invisible while keeping the performance coherent.

Reação em Cadeia da Física

Uma bola de gude rola por uma trilha de reação em cadeia com movimento e áudio contínuos.

A marble rolling fast on a chain reaction style track, continuous smooth shot.

Imagem + Vídeo + Referência de Áudio

Um clipe de ficção científica combina referências de imagem, vídeo e áudio em uma saída sincronizada.

Use image, motion video, and audio timing references to create a dynamic sci-fi clip.

Desenhando para filmagens realistas

Um desenho orienta o movimento enquanto o resultado final se torna uma filmagem realista.

Turn the drawing into realistic footage while using it only as a guide for movement.

Como planejar prompts do Omni

Três etapas para melhorar os prompts Gemini Omni Flash

O modelo recompensa intenções claras, funções de referência concretas e instruções explícitas sobre o que deve permanecer estável durante as edições.

Gemini Omni Flash step 1 source inputs
1

Escolha as entradas de origem

Decida se o clipe começa com texto, imagem, vídeo, áudio ou uma combinação de referências.

Gemini Omni Flash step 2 natural language edit
2

Descrever movimento e restrições

Nomeie o assunto, movimento, caminho da câmera, estilo, tempo de áudio e detalhes que o Gemini Omni Flash deve preservar.

Gemini Omni Flash step 3 multi-turn edit
3

Iterar conversacionalmente

Acompanhe com edições precisas, como alterações de materiais, alterações de ângulo de câmera, transferência de estilo ou remoção de objetos.

Gemini Omni Flash physics and world knowledge example

Vídeo de base no conhecimento mundial do Gemini

O Google descreve Omni como uma combinação de geração visual com o conhecimento de física, ciência, história e contexto cultural do Gemini. Isso ajuda os clipes a se tornarem mais do que visualmente plausíveis: eles podem ter um significado mais claro e explicar melhor ideias complexas.

Gemini Omni Flash transparency and reference motion example

Projetado com sinais de transparência

O anúncio oficial diz que todos os vídeos Omni incluem a marca d'água digital SynthID imperceptível do Google, com suporte de verificação por meio de superfícies de aplicativos Gemini, Gemini no Chrome e Pesquisa Google.

Planeje seu próximo vídeo estilo Omni

Escreva um prompt Gemini Omni Flash melhor

Use o prompt studio acima para transformar uma ideia criativa em um briefing estruturado para conversão de texto em vídeo, vídeo baseado em referência ou edição de conversação.

Referências de texto, imagem, vídeo e áudio
Edições multivoltas em linguagem natural
Mídia oficial de exemplo do Google
Notas de transparência SynthID
Perguntas frequentes sobre Gemini Omni Flash

Perguntas frequentes