in

Genmo presenta Mochi 1, el nuevo modelo de inteligencia artificial para videos.

La empresa de inteligencia artificial Genmo ha lanzado al mercado Mochi 1, un innovador modelo de código abierto para la generación de videos de alta calidad a partir de indicaciones de texto. Este avance se destaca por su rendimiento equiparable o superior al de otros competidores de código cerrado, como Gen-3 Alpha de Runway, Dream Machine de Luma AI, Kling de Kuaishou, Hailuo de Minimax, entre otros.

Mochi 1, disponible bajo la licencia Apache 2.0, brinda a los usuarios acceso gratuito a capacidades de generación de videos de vanguardia, en contraste con otros modelos que pueden iniciar con capas gratuitas limitadas y llegar a costar hasta $94.99 al mes. Además del lanzamiento del modelo, Genmo también ofrece un espacio de experimentación en línea para que los usuarios puedan explorar de primera mano las características de Mochi 1.

Este modelo, que actualmente ofrece video en calidad 480p, promete una versión en alta definición, Mochi 1 HD, que se espera lanzar más adelante en el año. Videos iniciales compartidos con VentureBeat han mostrado paisajes y movimientos sorprendentemente realistas, especialmente en escenas con sujetos humanos, como el video de una anciana que se puede apreciar aquí.

Genmo ha enmarcado a Mochi 1 como una solución que reduce la brecha entre los modelos de generación de video abiertos y cerrados. Según la empresa, Mochi 1 destaca en seguir instrucciones detalladas del usuario, permitiendo un control preciso sobre personajes, escenarios y acciones en los videos generados. En pruebas internas, Genmo afirma que Mochi 1 supera a la mayoría de los modelos de IA de video, incluidos los competidores Runway y Luna, en cuanto a fidelidad a las indicaciones y calidad del movimiento.

En paralelo al lanzamiento de la versión preliminar de Mochi 1, Genmo ha anunciado una ronda de financiación de Serie A por un total de $28.4 millones, liderada por NEA y con la participación de otros inversores destacados. Esta inversión respalda la visión de Genmo de avanzar en la generación de videos y desarrollar tecnologías que impulsen el futuro de la inteligencia artificial en general.

La arquitectura del modelo Mochi 1 se basa en la novedosa estructura Asymmetric Diffusion Transformer (AsymmDiT), con 10 mil millones de parámetros, convirtiéndose en el modelo de generación de video de código abierto más grande jamás lanzado. La eficiencia es un aspecto clave del diseño de Mochi 1, ya que emplea un codificador-decodificador variacional de video que comprime los datos de video a una fracción de su tamaño original, lo que lo hace accesible para la comunidad de desarrolladores.

En cuanto al conjunto de datos de entrenamiento del modelo, Genmo se muestra cauteloso en revelar detalles específicos por motivos competitivos, aunque señala la importancia de contar con datos diversos para un mejor desarrollo de la tecnología.

A pesar de ser una versión preliminar, Mochi 1 presenta algunas limitaciones, como el soporte únicamente de resolución 480p y posibles distorsiones visuales en casos de movimientos complejos. No obstante, Genmo planea lanzar Mochi 1 HD este mismo año para mejorar la calidad de movimiento y ofrecer resolución 720p. Además, la empresa está trabajando en capacidades de síntesis de imagen a video y en mejorar la capacidad de control del modelo para brindar a los usuarios un mayor control sobre los resultados de video.

La liberación de Mochi 1 abre nuevas posibilidades en diversas industrias: desde la investigación en tecnologías de generación de video hasta aplicaciones en entretenimiento, publicidad y educación. Además, Mochi 1 puede utilizarse para generar datos sintéticos en el entrenamiento de modelos de IA en robótica y sistemas autónomos.

Genmo invita a los usuarios a probar la versión preliminar de Mochi 1 a través de su espacio de experimentación, aunque al momento de redactar este artículo, la URL no cargaba la página correcta. Como parte de su desarrollo continuo, Genmo busca talento para unirse a su equipo de investigación y seguir avanzando en la generación de videos y en su visión del futuro de la inteligencia artificial.

¿Qué opinas?

120 Votos
Upvote Downvote

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

One Comment

  1. Vaya, ¡la tecnología no deja de sorprenderme! 😮 Este nuevo modelo de inteligencia artificial para videos suena increíble. Imagino que la calidad de los videos mejorará muchísimo con esta nueva herramienta. ¡Qué emocionante ver cómo avanza la tecnología! 🚀 ¡Gracias por mantenernos al tanto de estas innovaciones!

Jalen Suggs renueva contrato con Orlando Magic por 5 años y 150,5 millones

Nike enfrenta desafío sin precedentes con el respaldo clave de Tim Cook.