De generación de texto a generación de imágenes y ahora generación de video: así evoluciona la inteligencia artificial generativa, con avances cada vez más impresionantes y profundos que culminarán en una superinteligencia.
Finalizando 2024, específicamente en los primeros días de diciembre, OpenAI finalmente puso su modelo de generación de videos Sora a .disposición del público usuario de ChatGPT en versiones Pro, Plus y Team.
Sora, que había sido inicialmente presentado en febrero de 2024, es impresionante desde el punto de vista de que genera videos de calidad a partir de puro texto, con movimientos y transiciones realistas.
Aunque en febrero se habló de videos de hasta un minuto, en la práctica Sora genera videos de hasta 20 segundos de duración y resolución máxima de 1,080p. Según el plan que se tenga, tanto la resolución como la duración pueden ser menores.
No se descarta que eventualmente OpenAI aumente la duración y resolución de videos generados por Sora, pero, como esta es una industria muy competitiva, a los pocos días de la disponibilidad de Sora salió un rival al ruedo con mejores condiciones: Veo 2.
Desarrollado por DeepMind, subsidiaria de Alphabet, Veo es la propuesta de Google en términos de modelos de generación de video.
Las ventajas de Veo 2, anunciado a mediados de diciembre pasado, son considerables frente a la oferta de Sora: videos de más de 2 minutos de duración en hasta 4K a partir de instrucciones que pueden ser simples o complejas.
Sin embargo, las ventajas de Veo 2 solo son en teoría, pues en la práctica, para quienes tienen acceso a través de VideoFX tras agotar el proceso de lista de espera, los videos resultantes están limitados a 8 segundos de duración a 720p.
¿Quién ganará la batalla de la generación de videos por inteligencia artificial? Es evidente que Google lleva alguna ventaja sobre OpenAI en términos de desarrollo, pero esta no se refleja a nivel de usuario, y eso podría ser un problema.
Asimismo, es casi seguro que OpenAI seguirá sacando versiones más avanzadas de Sora, por tanto habrá que ver otros factores, entre ellos facilidad de uso y acceso, precio, precisión de los resultados y, muy importante, en fuste ético y de seguridad.
Al final del día, una pregunta más interesante es cuál será el impacto de estas herramientas de generación de video en el día a día.
Desde hace mucho se viene advirtiendo que los avances en inteligencia artificial tienen el potencial de exacerbar el fenómeno de fake news por vía de los deepfakes, siendo esta la razón por la que OpenAI tomó previsiones que dejan claro el origen de un video generado por Sora
Luego está la cuestión de cómo impactan estas herramientas a nivel profesional: ¿terminarán por hacer daño a editores profesionales de video, o quizás les facilite el trabajo? ¿Cómo complementar trabajo humano y de inteligencia artificial satisfactoriamente?
Como ven, muchas interrogantes quedan en el aire.