La competencia por desarrollar el mejor modelo de video generativo con inteligencia artificial continúa. Tras el hito marcado Sora, de OpenAI, con sus capacidades de videos hiperrealistas, Google ha presentado su alternativa: VEO.
De acuerdo con la compañía, se trata de un nuevo generador de video a partir de texto en forma de tomas cinematográficas, abordando diferentes estilos, desde fotorrealismo hasta surrealismo, animación o timelapse.
Según Google, este IR también puede crear clips en calidad 1080p de alta calidad que pueden durar más de 60 segundos, y tiene una "comprensión avanzada del lenguaje natural y la semántica visual" para generar contenido de forma más sencilla.
Durante el Google I/O 24, la compañía mostró algunas de las capacidades del modelo, creando videos bastante detallados de autos llegando a casas o de barcos en el océano, lo que permite apreciar su manejo de la física del mundo real, reproduciendo también contenido en alta definición.
Cómo probar VEO
Junto a VEO, Google también presentó Imagen 3, su nuevo modelo de texto a imagen, capaz de generar imágenes fotorrealistas, mejorando en la interpretación del lenguaje natural y añadiendo detalles específicos mediante prompts extensos.
Eso no es todo, ya que la compañía también ha optimizado este modelo para la creación de imágenes que incluyan texto, generando palabras o frases con algún estilo específico.
Ambas IAs, Veo e Imagen 3, ya están disponibles a través de acceso anticipado para algunos creadores de VideoFX e ImageFX. Además, existe una lista de espera para acceder a sus plataformas. En el caso de VEO, Google adelantó que se espera que se integre en YouTube Shorts en el futuro.