in

Nvidia lanza marco de inteligencia artificial para modelos de 8 mil millones gestionando herramientas con precisión.

La revolución de la inteligencia artificial (IA) está en constante evolución, y uno de los últimos avances en este campo ha sido presentado por investigadores de Nvidia y la Universidad de Hong Kong. Han desarrollado un marco de trabajo de aprendizaje automático llamado ToolOrchestra, que permite entrenar modelos pequeños para que actúen como coordinadores inteligentes de herramientas y modelos de lenguaje de gran tamaño (LLM). Este enfoque innovador busca mejorar la eficiencia y la precisión en la resolución de problemas complejos.

En el corazón de ToolOrchestra se encuentra Orchestrator, un modelo de 8 mil millones de parámetros que demostró ser capaz de coordinar diferentes herramientas y LLM para resolver problemas complejos de manera más precisa y eficiente que modelos mucho más grandes. Según los resultados obtenidos, Orchestrator logró una mayor precisión a un costo menor en comparación con modelos más grandes en pruebas de uso de herramientas, mientras se alineaba con las preferencias de los usuarios sobre qué herramientas utilizar para una consulta determinada.

El secreto detrás de este avance radica en el enfoque de orquestación de herramientas, que implica cambiar de un sistema de modelo único a uno compuesto, gestionado por un modelo «orquestador» ligero. Este orquestador analiza tareas complejas, las divide en subproblemas más pequeños y activa las herramientas adecuadas en el orden correcto para llegar a una solución. Esto permite una mayor flexibilidad y eficiencia en la resolución de problemas, ya que el orquestador puede delegar subproblemas específicos a herramientas especializadas.

ToolOrchestra utiliza un proceso de entrenamiento de aprendizaje por refuerzo (RL) que guía al modelo para que aprenda cuándo y cómo llamar a otras herramientas y modelos, y cómo combinar sus resultados en un razonamiento multi-turno. El proceso de entrenamiento se basa en un sistema de recompensas que equilibra la corrección de la respuesta final, la eficiencia en términos de costo y latencia, y la alineación con las preferencias del usuario.

Los resultados obtenidos con Orchestrator son prometedores. En pruebas de referencia desafiantes, como HLE (el último examen de la humanidad), FRAMES y Tau2-Bench, Orchestrator superó a métodos anteriores con una fracción del costo computacional. Además, el modelo demostró ser capaz de adaptarse a nuevos desafíos y generalizar bien a modelos y estructuras de precios que no había visto durante el entrenamiento.

Este avance tiene implicaciones significativas para las empresas que buscan implementar agentes de IA más avanzados. La capacidad de orquestar herramientas y modelos de manera eficiente y personalizable ofrece un enfoque práctico para construir sistemas de IA sofisticados que puedan escalar. Además, el hecho de que los pesos del modelo estén disponibles bajo una licencia no comercial y que el código de entrenamiento se haya publicado bajo la licencia Apache 2.0 fomenta la colaboración y la innovación en la comunidad de IA.

En resumen, el desarrollo de ToolOrchestra y Orchestrator representa un paso importante hacia la creación de sistemas de IA más inteligentes, económicos y controlables. A medida que las empresas buscan implementar soluciones de IA más avanzadas, este enfoque de orquestación de herramientas ofrece un camino prometedor hacia el futuro.

¿Qué opinas?

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Camilla reina con esmeraldas y sostenibilidad en cena de gala en Alemania

Michelle Yeoh protagoniza ‘Sandiwara’, nuevo proyecto de Sean Baker en Self-Portrait