Gemini Omni Flash revoluciona la edición de videos con inteligencia artificial conversacional

Google ha presentado Gemini Omni, su más reciente avance en inteligencia artificial que fusiona capacidades de razonamiento con generación de contenido audiovisual. La versión Flash de este modelo, disponible en aplicaciones como Gemini, Google Flow y YouTube Shorts, permite a los usuarios editar videos mediante conversaciones en lenguaje natural. La herramienta comprende la física y la continuidad de las escenas, lo que posibilita realizar cambios coherentes en el contenido grabado. Entre las funcionalidades principales destaca la capacidad de transformar elementos visuales, modificar acciones dentro de videos existentes, agregar personajes u objetos nuevos, cambiar ambientes, ángulos y estilos, así como mejorar grabaciones en múltiples tomas. El modelo integra conocimientos de física, historia, ciencia y contexto cultural para generar escenas que parecen reales. Utiliza su comprensión de gravedad, energía cinética y dinámica de fluidos combinada con creatividad para producir imágenes realistas. Gemini Omni puede procesar referencias visuales, de audio e imágenes para crear resultados coherentes, aunque actualmente solo admite referencias de voz para audio. En cuanto a seguridad, Google implementó avatares digitales para que los usuarios utilicen su propia voz sin riesgos. Los videos generados incluyen una marca de agua invisible de SynthID que puede verificarse a través de Gemini, Gemini en Chrome y Búsqueda de Google, medidas adoptadas para proteger a los usuarios y regular el uso responsable de estas herramientas de inteligencia artificial.

Gemini Omni Flash revoluciona la edición de videos con inteligencia artificial conversacional

Comparte este post