in

La Inteligencia Artificial se autoenseña con el innovador marco de MIT

Investigadores del MIT desarrollan un marco para que los modelos de lenguaje se adapten y aprendan de manera autónoma

En un avance significativo en el campo de la inteligencia artificial, un equipo de investigadores del Instituto de Tecnología de Massachusetts (MIT) ha creado un marco denominado Modelos de Lenguaje Autoadaptables (SEAL). Este innovador enfoque permite a los grandes modelos de lenguaje (LLMs) aprender y adaptarse de manera continua, actualizando sus propios parámetros internos.

La capacidad de los LLMs para adaptarse a nuevas tareas y absorber información actualizada es un desafío constante en el sector empresarial, particularmente en entornos dinámicos donde la información cambia constantemente. SEAL aborda este desafío al enseñar a un LLM a generar sus propios datos de entrenamiento y directivas de ajuste, lo que le permite incorporar de forma permanente nuevo conocimiento y aprender nuevas tareas.

El marco SEAL opera a través de un sistema de doble bucle. En el «bucle interno», el modelo utiliza una autoedición para realizar una pequeña actualización temporal de sus pesos. En el «bucle externo», el sistema evalúa si esa actualización mejoró el rendimiento del modelo en una tarea específica. Si es así, el modelo recibe una recompensa positiva, lo que refuerza su capacidad para generar ese tipo de autoedición efectiva en el futuro.

Los investigadores probaron SEAL en dos ámbitos clave: la incorporación de conocimiento y el aprendizaje con pocos ejemplos. En la incorporación de conocimiento, el objetivo era evaluar si el modelo podía responder a preguntas sobre un pasaje de texto sin tener acceso a él durante la pregunta. Los resultados mostraron que SEAL superó significativamente los métodos tradicionales de ajuste fino.

En el aprendizaje con pocos ejemplos, SEAL logró una tasa de éxito del 72,5% en la resolución de puzzles visuales, un marcado contraste con el 20% logrado sin entrenamiento de refuerzo y el 0% de aprendizaje contextual estándar. Esto sugiere que SEAL permite a los modelos de lenguaje aprender de manera más eficiente y generalizar a partir de unos pocos ejemplos.

Este avance tiene importantes implicaciones para las empresas. La capacidad de los LLMs para generar su propio material de entrenamiento y adaptarse de manera autónoma podría revolucionar la forma en que se desarrollan y despliegan los modelos de inteligencia artificial. A medida que la demanda de datos de alta calidad para el entrenamiento de modelos sigue creciendo, enfoques como SEAL ofrecen una solución prometedora para superar las limitaciones actuales.

Sin embargo, SEAL no está exento de desafíos. Uno de los principales obstáculos es el «olvidó catastrófico», donde los ciclos constantes de reentrenamiento pueden provocar que el modelo olvide su conocimiento previo. Los investigadores proponen un enfoque híbrido, donde las empresas sean selectivas sobre qué conocimiento es lo suficientemente importante como para integrarlo de forma permanente.

A pesar de estos desafíos, el desarrollo de SEAL representa un paso significativo hacia la creación de modelos de lenguaje más adaptables y autónomos. A medida que esta tecnología siga evolucionando, es probable que tenga un impacto profundo en diversas industrias, desde la atención al cliente hasta la investigación y el desarrollo.

¿Qué opinas?

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

G-III demanda a PVH por disputa de licencias valorada en 250 millones dólares

La tercera temporada de ‘The Gilded Age’ desentraña el futuro de George Russell