Skip to content

Estudio Gemini Omni Flash

Borradores de indicaciones para la generación de videos multimodales y ediciones de videos en lenguaje natural inspiradas en el modelo Omni Gemini de Google.

Model
Gemini Omni Flash model preview
Gemini Omni FlashPreview

Multimodal video generation and editing

Tipo de creación

Funciona mejor con sujetos, movimiento, cámara, audio, entradas de referencia y restricciones para preservar.

Ejemplos oficiales de Gemini Omni

Los clips de referencia del anuncio de Google muestran creación de texto a video, ediciones en lenguaje natural, referencias multimodales y física fundamentada.

Gemini Obra de arte oficial del héroe Omni Flash
Gemini Marco de vídeo de montaje del alfabeto Omni Flash
Gemini Obra de arte oficial del héroe Omni Flash
Gemini Marco de vídeo de montaje del alfabeto Omni Flash
Arrastra para comparar

Montaje alfabético generado a partir de un mensaje de texto complejo.

Generador de vídeo IA Gemini Omni Flash

Gemini Omni Flash es el primer modelo Gemini Omni de Google: un sistema de video multimodal para crear clips a partir de referencias de texto, imágenes, video y audio, y luego refinarlos con ediciones conversacionales.

Pruebe las indicaciones de flash Omni Gemini
Gemini Omni Flash official announcement artwork
¿Qué es Gemini Omni Flash?

Un modelo de vídeo Gemini creado para la creación y edición

Gemini Omni Flash es el primer modelo de la familia Gemini Omni de Google. Google lo presenta como una forma de crear cualquier cosa a partir de cualquier entrada, incluidos texto, imágenes, videos y referencias de voz, y luego seguir editando con un lenguaje conversacional natural.

El modelo está diseñado para más de una generación. Los ejemplos oficiales muestran edición de múltiples turnos, cambios de estilo, transferencia de movimiento, transformaciones de materiales, cambios de ángulo de cámara y sincronización visual con reconocimiento de audio.

Para los creadores y equipos, el valor práctico es una iteración más rápida: comience con una indicación o referencia, realice ediciones específicas en un lenguaje sencillo y mantenga el clip coherente en cuanto a movimiento, estilo, sonido e historia.

Vídeo de cualquier entrada

Cree videos a partir de texto, imágenes, referencias de videos y entradas de voz compatibles.

ediciones conversacionales

Itere con lenguaje natural conservando el tema, el tiempo y el movimiento.

transparencia SynthID

Google dice que todos los vídeos de Omni incluyen su imperceptible marca de agua SynthID.

Gemini Omni Flash multimodal video model overview

Gemini Omni Flash overview

Create from references, edit by conversation, and preserve coherent motion.

Por qué es importante Gemini Omni Flash

Un nuevo flujo de trabajo para la creación de vídeos con IA

Gemini Omni Flash combina generación, edición, comprensión de referencias y conocimiento mundial en un flujo de trabajo de video.

Texto a vídeo

Convierta indicaciones compactas en clips cinematográficos, explicaciones, estudios de movimiento y escenas sociales.

mensaje al videomovimiento cinemáticoclips de formato corto

Edición de lenguaje natural

Solicite ediciones como nuevos materiales, entornos modificados, objetos invisibles o nuevos ángulos de cámara.

ediciones de varios turnoslenguaje sencilloiteración más rápida

Referencias multimodales

Combine imágenes, videos, texto y referencias de voz compatibles en una salida coherente.

referencia de imagentransferencia de movimientotemporización de audio

Conocimiento mundial y física.

Utilice el conocimiento de Gemini y el razonamiento físico mejorado para escenas más significativas y creíbles.

gravitydinámica de fluidosexplicadores visuales

Crear, editar y volver a hacer referencia a un vídeo

Utilice Gemini Omni Flash para los flujos de trabajo destacados por Google: creación de texto, edición iterativa y composición basada en referencias.

Concepto de texto a video

Concepto de texto a video

Comience a partir de un resumen creativo compacto y genere un clip con movimiento, lenguaje de cámara y dirección de sonido.

Ediciones de vídeo en lenguaje natural

Ediciones de vídeo en lenguaje natural

Cambie materiales, elimine objetos, modifique los ángulos de la cámara o cambie el estilo de una escena sin trabajo manual en la línea de tiempo.

Producción basada en referencias

Producción basada en referencias

Utilice medios de referencia para identidad, movimiento, estilo y sincronización de audio, luego combínelos en una sola salida.

Medios oficiales de referencia

Gemini Ejemplos de vídeo Omni Flash

Estos clips hacen referencia a los medios del anuncio Omni Gemini de Google y se incluyen para mostrar los tipos de flujos de trabajo de generación y edición que demuestra el artículo.

Fuente: Blog de Google

Montaje de mensaje de texto complejo

Una secuencia alfabética utiliza cambios rápidos de objetos, tercios inferiores y música a partir de un mensaje detallado.

Create an alphabet montage with unusual objects, matching lower thirds, and calm music.

Espejo líquido Editar

Una edición en lenguaje natural convierte un espejo en un líquido ondulante y transforma un brazo en material reflectante.

Make the mirror ripple beautifully like liquid and make the arm reflective.

Violín multivuelta Editar

El artículo muestra cómo cambiar el mismo clip de violín en varias ediciones, incluida la eliminación del instrumento visible.

Make the violin invisible while keeping the performance coherent.

Reacción en cadena de la física

Una canica rueda a través de una pista de reacción en cadena con movimiento y audio continuos.

A marble rolling fast on a chain reaction style track, continuous smooth shot.

Imagen + Vídeo + Referencia de Audio

Un clip de ciencia ficción combina referencias de imagen, vídeo y audio en una salida sincronizada.

Use image, motion video, and audio timing references to create a dynamic sci-fi clip.

Dibujar imágenes realistas

Un dibujo guía el movimiento mientras el resultado final se convierte en metraje realista.

Turn the drawing into realistic footage while using it only as a guide for movement.

Cómo planificar indicaciones de Omni

Tres pasos para mejorar las indicaciones de Gemini Omni Flash

El modelo premia una intención clara, roles de referencia concretos e instrucciones explícitas sobre lo que debe permanecer estable durante las ediciones.

Gemini Omni Flash step 1 source inputs
1

Elija las entradas de origen

Decide si el clip comienza a partir de texto, imagen, vídeo, audio o una combinación de referencias.

Gemini Omni Flash step 2 natural language edit
2

Describir el movimiento y las restricciones.

Nombra el sujeto, el movimiento, la trayectoria de la cámara, el estilo, la sincronización del audio y los detalles que Gemini Omni Flash debe conservar.

Gemini Omni Flash step 3 multi-turn edit
3

Iterar conversacionalmente

Realice un seguimiento con ediciones precisas, como cambios de material, cambios de ángulo de cámara, transferencia de estilo o eliminación de objetos.

Gemini Omni Flash physics and world knowledge example

Vídeo terrestre en el conocimiento mundial de Gemini

Google describe Omni como una combinación de generación visual con el conocimiento de física, ciencia, historia y contexto cultural de Gemini. Eso ayuda a que los clips sean más que visualmente plausibles: pueden transmitir un significado más claro y explicar mejor ideas complejas.

Gemini Omni Flash transparency and reference motion example

Diseñado con señales de transparencia.

El anuncio oficial dice que todos los videos de Omni incluyen la imperceptible marca de agua digital SynthID de Google, con soporte de verificación a través de superficies de aplicaciones Gemini, Gemini en Chrome y Búsqueda de Google.

Planifica tu próximo vídeo estilo Omni

Escriba un mensaje de flash Omni Gemini mejor

Utilice el estudio de sugerencias anterior para convertir una idea creativa en un resumen estructurado para convertir texto a video, video basado en referencias o edición conversacional.

Referencias de texto, imagen, video y audio.
Ediciones de varios turnos en lenguaje natural
Medios de ejemplo oficiales de Google
Notas de transparencia SynthID
Preguntas frecuentes sobre Gemini Omni Flash

Preguntas frecuentes