Liquid, empresa derivada de MIT, lanza modelos AI pequeños y eficientes.

La startup Liquid AI, cofundada por antiguos investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del Instituto Tecnológico de Massachusetts (MIT), ha presentado sus primeros modelos de inteligencia artificial multimodales.

Estos modelos, conocidos como «Liquid Foundation Models (LFMs)», se destacan por no basarse en la arquitectura transformer descrita en el influyente artículo de 2017 «Attention Is All You Need». En cambio, Liquid afirma que su objetivo es explorar formas de construir modelos fundamentales más allá de los Generative Pre-trained Transformers (GPTs), utilizando principios básicos similares a los empleados por ingenieros en la construcción de motores, automóviles y aviones.

Los LFMs están disponibles en tres tamaños y variantes diferentes: LFM 1.3B (el más pequeño), LFM 3B y LFM 40B MoE (el más grande, un modelo «Mixture-of-Experts» similar al Mixtral de Mistral). La «B» en sus nombres hace referencia a mil millones, indicando la cantidad de parámetros que rigen el procesamiento de información, el análisis y la generación de resultados del modelo. Por lo general, los modelos con un mayor número de parámetros son más capaces en una variedad más amplia de tareas.

Liquid AI asegura que el modelo LFM 1.3B supera en rendimiento a los modelos basados en transformer de tamaño comparable, como el Llama 3.2-1.2B de Meta y el Phi-1.5 de Microsoft, en numerosas pruebas de referencia externas, incluyendo el desafiante Massive Multitask Language Understanding (MMLU), que abarca 57 problemas en campos científicos, tecnológicos, de ingeniería y matemáticas (STEM); siendo la primera vez que una arquitectura no basada en GPT supera de manera significativa a los modelos basados en transformer.

Estos modelos están diseñados para ofrecer un rendimiento de vanguardia al tiempo que optimizan la eficiencia de memoria, con el LFM-3B de Liquid requiriendo solo 16 GB en comparación con los más de 48 GB necesarios por el modelo Llama-3.2-3B de Meta.

La voz de Maxime Labonne, Jefe de Posentrenamiento en Liquid AI, resuena con orgullo al describir los LFMs como «el lanzamiento más destacado de mi carrera :)», destacando la capacidad de estos modelos para superar a los basados en transformer utilizando significativamente menos memoria.

Liquid AI ha construido sus modelos base para ser versátiles en múltiples modalidades de datos, incluyendo audio, video y texto, con el objetivo de abordar un amplio espectro de desafíos específicos de la industria, desde servicios financieros hasta biotecnología y electrónica de consumo.

Aunque los modelos no son de código abierto, los usuarios pueden acceder a ellos a través del playground de inferencia de Liquid, Lambda Chat, o Perplexity AI. La compañía se encuentra optimizando sus modelos para su despliegue en hardware de NVIDIA, AMD, Apple, Qualcomm y Cerebras, extendiendo invitaciones a adoptadores tempranos y desarrolladores para probar y brindar retroalimentación sobre los modelos.

Liquid, empresa derivada de MIT, lanza modelos AI pequeños y eficientes.

¿Qué opinas?

Escrito por Redacción - El Semanal

Deja una respuestaCancelar la respuesta

Trabajos en plataformas digitales que generan ingresos sin licencia de conducir

Los 10 mejores cursos digitales para formar equipos competitivos

Ampliación del servicio de Comunicaciones en Rico con iPhone, llega a más operadoras con la versión beta 3 de iOS 18.

Dos fuertes sismos en el Pacífico ruso activan alerta por tsunami

El flamante rascacielos de Dubai prioriza la vida saludable desde su construcción.

Tone de Kai Cenat y AMP lanza su línea en Target ahora

Jane Remover lanza remix de «Shake It Like A» de Frost Children y Danny Brown: ¡Escúchalo!

Cohere presenta nuevos modelos de IA para unir idiomas en todo el mundo.

Caminata por la Verdad y la Reconciliación en Kitchener: Unión de la Comunidad

Millonaria inversión para mejorar sistemas de riego en Girona.

Israel anuncia una nueva ofensiva para recuperar el control de Gaza

Carney prioriza el crecimiento de Canadá mientras avanza el diálogo con Estados Unidos

La inteligencia artificial desplaza a los actores de doblaje en la industria india

Los aranceles estadounidenses alcanzan su nivel más alto en un siglo

Carney y grupos métis analizan proyecto de ley clave para obras nacionales

¿Qué opinas?

Deja una respuestaCancelar la respuesta

Log In

With social network:

Or with username:

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections

Suscríbete a El Semanal