Se lanza CogVideoX, la IA que transformará la creación de vídeos para siempre.

Un nuevo modelo de inteligencia artificial de código abierto, llamado CogVideoX, podría cambiar la forma en que creamos videos para siempre. Desarrollado por investigadores de la Universidad de Tsinghua y Zhipu AI, este modelo de texto a video amenaza con sacudir el panorama de la IA dominado por startups como Runway, Luma AI y Pika Labs. Este avance, detallado en un reciente artículo de arXiv, pone capacidades avanzadas de generación de video en manos de desarrolladores de todo el mundo.

CogVideoX es capaz de generar videos coherentes de alta calidad de hasta seis segundos de duración a partir de indicaciones de texto. Según las pruebas de referencia de los investigadores, el modelo supera a competidores conocidos como VideoCrafter-2.0 y OpenSora en múltiples métricas.

El modelo estrella del proyecto, CogVideoX-5B, cuenta con 5 mil millones de parámetros y produce videos de resolución 720×480 a 8 fotogramas por segundo. Aunque estas especificaciones pueden no estar a la vanguardia de los sistemas propietarios, la verdadera innovación de CogVideoX radica en su naturaleza de código abierto.

Al hacer que su código y los pesos del modelo estén públicamente disponibles, el equipo de Tsinghua ha democratizado efectivamente una tecnología que anteriormente era exclusiva de empresas tecnológicas bien financiadas. Este enfoque podría acelerar el progreso en video generado por IA al aprovechar el poder colectivo de la comunidad global de desarrolladores.

Para mejorar el alineamiento entre videos y textos, los investigadores implementaron un Variational Autoencoder (VAE) en 3D para comprimir videos de manera eficiente y desarrollaron un «transformador experto» para mejorar la alineación entre texto y video.

La disponibilidad generalizada de esta potente tecnología no está exenta de riesgos. La posibilidad de uso indebido en la creación de deepfakes o contenido engañoso es una preocupación real que la comunidad de IA debe abordar. Los investigadores reconocen estas implicaciones éticas y abogan por un uso responsable de la tecnología.

A medida que los videos generados por IA se vuelven más accesibles y sofisticados, estamos entrando en un territorio inexplorado en el ámbito de la creación de contenido digital. El lanzamiento de CogVideoX podría marcar un punto de inflexión, desplazando el equilibrio de poder lejos de los actores más grandes en el campo y hacia un modelo de desarrollo de IA más distribuido y de código abierto.

El verdadero impacto de esta democratización aún está por verse. ¿Desatará una nueva era de creatividad e innovación, o exacerbará los desafíos existentes en torno a la desinformación y la manipulación digital? A medida que la tecnología continúe evolucionando, los responsables políticos y los éticos deberán trabajar en estrecha colaboración con la comunidad de IA para establecer pautas para el desarrollo y uso responsables.

Lo que es seguro es que con CogVideoX ahora en circulación, el futuro de los videos generados por IA ya no está confinado a los laboratorios del Silicon Valley. Está en manos de desarrolladores de todo el mundo, para bien o para mal.

¿Qué opinas?

120 Votos
Upvote Downvote

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

México congela relaciones diplomáticas con embajadas de EE.UU y Canadá tras disputa judicial.

Lucas Vázquez suma exitosas victorias con James Rodríguez en la Liga española.