in

Investigadores de OpenAI aceleran la generación de medios en un 50%

Un nuevo avance en inteligencia artificial promete revolucionar la generación de contenido multimedia, como imágenes, videos y audio, a una velocidad sin precedentes. Investigadores de OpenAI han desarrollado un innovador modelo de consistencia en tiempo continuo (sCM) que acelera el proceso generativo en un 50% en comparación con los modelos de difusión tradicionales.

Este avance, presentado en un artículo pre-revisionado publicado en arXiv.org y en una entrada de blog reciente, lleva la firma de Cheng Lu y Yang Song. Este nuevo modelo permite la generación de muestras de alta calidad en solo dos pasos, lo que supone una mejora significativa respecto a los modelos de difusión anteriores, que requerían cientos de pasos.

A diferencia de los modelos de difusión convencionales, que necesitan una gran cantidad de pasos de desruido para crear una muestra, el sCM convierte directamente el ruido en muestras de alta calidad en uno o dos pasos, reduciendo así el costo y el tiempo computacional. De hecho, el modelo más grande de sCM de OpenAI, con 1.5 mil millones de parámetros, puede generar una muestra en tan solo 0.11 segundos en una sola GPU A100.

Esta mejora en la velocidad de generación se traduce en un incremento de 50 veces en comparación con los modelos de difusión, lo que hace posible aplicaciones de inteligencia artificial generativa en tiempo real. Además, a pesar de la velocidad aumentada, el modelo mantiene una calidad de muestra que rivaliza con los mejores modelos de difusión, demostrando su eficacia y rendimiento.

Los benchmarks realizados revelan un sólido desempeño del sCM en comparación con otros modelos generativos de última generación, mostrando una calidad de muestra superior y una sobrecarga computacional significativamente menor. Esta capacidad del modelo para escalar proporcionalmente con el modelo de difusión «profesor» del cual obtiene conocimiento es una de las claves de su éxito, permitiendo cerrar la brecha en la calidad de la muestra a medida que ambos modelos crecen en tamaño.

Este avance tiene importantes implicaciones en la generación de IA en tiempo real en diversas áreas, desde la generación de imágenes hasta la síntesis de audio y video, ofreciendo una solución práctica para aplicaciones que requieren resultados rápidos y de alta calidad. Además, las investigaciones de OpenAI sugieren que aún hay margen para optimizar el sistema y mejorar aún más su rendimiento, adaptándolo a las necesidades específicas de diferentes industrias.

¿Qué opinas?

120 Votos
Upvote Downvote

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

One Comment

  1. ¡Wow, no me lo puedo creer! ¿En serio OpenAI logró acelerar la generación de medios en un 50%? ¡Eso es increíblemente impresionante! ¡Imagínate todo lo que podríamos lograr con esta tecnología! ¿Crees que esta innovación cambiará la forma en la que consumimos información en el futuro?

Nuevo software de iOS 18.2 implementa detección de apnea del sueño en Apple Watch en Canadá.

Revolut, la revolución financiera del siglo XXI que debes conocer