Estudio Gemini Omni Flash
Borradores de indicaciones para la generación de videos multimodales y ediciones de videos en lenguaje natural inspiradas en el modelo Omni Gemini de Google.
Multimodal video generation and editing
Funciona mejor con sujetos, movimiento, cámara, audio, entradas de referencia y restricciones para preservar.
Ejemplos oficiales de Gemini Omni
Los clips de referencia del anuncio de Google muestran creación de texto a video, ediciones en lenguaje natural, referencias multimodales y física fundamentada.


Montaje alfabético generado a partir de un mensaje de texto complejo.
Generador de vídeo IA Gemini Omni Flash
Gemini Omni Flash es el primer modelo Gemini Omni de Google: un sistema de video multimodal para crear clips a partir de referencias de texto, imágenes, video y audio, y luego refinarlos con ediciones conversacionales.
Pruebe las indicaciones de flash Omni Gemini
Un modelo de vídeo Gemini creado para la creación y edición
Gemini Omni Flash es el primer modelo de la familia Gemini Omni de Google. Google lo presenta como una forma de crear cualquier cosa a partir de cualquier entrada, incluidos texto, imágenes, videos y referencias de voz, y luego seguir editando con un lenguaje conversacional natural.
El modelo está diseñado para más de una generación. Los ejemplos oficiales muestran edición de múltiples turnos, cambios de estilo, transferencia de movimiento, transformaciones de materiales, cambios de ángulo de cámara y sincronización visual con reconocimiento de audio.
Para los creadores y equipos, el valor práctico es una iteración más rápida: comience con una indicación o referencia, realice ediciones específicas en un lenguaje sencillo y mantenga el clip coherente en cuanto a movimiento, estilo, sonido e historia.
Vídeo de cualquier entrada
Cree videos a partir de texto, imágenes, referencias de videos y entradas de voz compatibles.
ediciones conversacionales
Itere con lenguaje natural conservando el tema, el tiempo y el movimiento.
transparencia SynthID
Google dice que todos los vídeos de Omni incluyen su imperceptible marca de agua SynthID.

Gemini Omni Flash overview
Create from references, edit by conversation, and preserve coherent motion.
Un nuevo flujo de trabajo para la creación de vídeos con IA
Gemini Omni Flash combina generación, edición, comprensión de referencias y conocimiento mundial en un flujo de trabajo de video.
Texto a vídeo
Convierta indicaciones compactas en clips cinematográficos, explicaciones, estudios de movimiento y escenas sociales.
Edición de lenguaje natural
Solicite ediciones como nuevos materiales, entornos modificados, objetos invisibles o nuevos ángulos de cámara.
Referencias multimodales
Combine imágenes, videos, texto y referencias de voz compatibles en una salida coherente.
Conocimiento mundial y física.
Utilice el conocimiento de Gemini y el razonamiento físico mejorado para escenas más significativas y creíbles.
Crear, editar y volver a hacer referencia a un vídeo
Utilice Gemini Omni Flash para los flujos de trabajo destacados por Google: creación de texto, edición iterativa y composición basada en referencias.

Concepto de texto a video
Comience a partir de un resumen creativo compacto y genere un clip con movimiento, lenguaje de cámara y dirección de sonido.

Ediciones de vídeo en lenguaje natural
Cambie materiales, elimine objetos, modifique los ángulos de la cámara o cambie el estilo de una escena sin trabajo manual en la línea de tiempo.

Producción basada en referencias
Utilice medios de referencia para identidad, movimiento, estilo y sincronización de audio, luego combínelos en una sola salida.
Gemini Ejemplos de vídeo Omni Flash
Estos clips hacen referencia a los medios del anuncio Omni Gemini de Google y se incluyen para mostrar los tipos de flujos de trabajo de generación y edición que demuestra el artículo.
Fuente: Blog de GoogleMontaje de mensaje de texto complejo
Una secuencia alfabética utiliza cambios rápidos de objetos, tercios inferiores y música a partir de un mensaje detallado.
Create an alphabet montage with unusual objects, matching lower thirds, and calm music.
Espejo líquido Editar
Una edición en lenguaje natural convierte un espejo en un líquido ondulante y transforma un brazo en material reflectante.
Make the mirror ripple beautifully like liquid and make the arm reflective.
Violín multivuelta Editar
El artículo muestra cómo cambiar el mismo clip de violín en varias ediciones, incluida la eliminación del instrumento visible.
Make the violin invisible while keeping the performance coherent.
Reacción en cadena de la física
Una canica rueda a través de una pista de reacción en cadena con movimiento y audio continuos.
A marble rolling fast on a chain reaction style track, continuous smooth shot.
Imagen + Vídeo + Referencia de Audio
Un clip de ciencia ficción combina referencias de imagen, vídeo y audio en una salida sincronizada.
Use image, motion video, and audio timing references to create a dynamic sci-fi clip.
Dibujar imágenes realistas
Un dibujo guía el movimiento mientras el resultado final se convierte en metraje realista.
Turn the drawing into realistic footage while using it only as a guide for movement.
Tres pasos para mejorar las indicaciones de Gemini Omni Flash
El modelo premia una intención clara, roles de referencia concretos e instrucciones explícitas sobre lo que debe permanecer estable durante las ediciones.

Elija las entradas de origen
Decide si el clip comienza a partir de texto, imagen, vídeo, audio o una combinación de referencias.

Describir el movimiento y las restricciones.
Nombra el sujeto, el movimiento, la trayectoria de la cámara, el estilo, la sincronización del audio y los detalles que Gemini Omni Flash debe conservar.

Iterar conversacionalmente
Realice un seguimiento con ediciones precisas, como cambios de material, cambios de ángulo de cámara, transferencia de estilo o eliminación de objetos.

Vídeo terrestre en el conocimiento mundial de Gemini
Google describe Omni como una combinación de generación visual con el conocimiento de física, ciencia, historia y contexto cultural de Gemini. Eso ayuda a que los clips sean más que visualmente plausibles: pueden transmitir un significado más claro y explicar mejor ideas complejas.

Diseñado con señales de transparencia.
El anuncio oficial dice que todos los videos de Omni incluyen la imperceptible marca de agua digital SynthID de Google, con soporte de verificación a través de superficies de aplicaciones Gemini, Gemini en Chrome y Búsqueda de Google.
Explore más herramientas creativas de IA
Combine la planificación de vídeo estilo Omni con la generación y edición de imágenes y otros flujos de trabajo multimedia.

Generador de vídeo IA Veo 4
Cree clips de texto a video e imagen a video en un flujo de trabajo que prioriza el video.

Gemini Edición de imágenes flash
Edite imágenes con flujos de trabajo rápidos estilo Flash Gemini.

AI Image Editor
Utilice la edición basada en indicaciones para las transformaciones de imágenes cotidianas.

Galería de creación
Explore imágenes y vídeos creativos del estudio de IA más amplio.
Escriba un mensaje de flash Omni Gemini mejor
Utilice el estudio de sugerencias anterior para convertir una idea creativa en un resumen estructurado para convertir texto a video, video basado en referencias o edición conversacional.