Emprendimiento e Innovación

El Archon promete acelerar el rendimiento de LLMs sin costos adicionales.

La Inteligencia Artificial (IA) sigue avanzando y sorprendiendo, esta vez con un nuevo marco de inferencia que promete acelerar el procesamiento de los grandes modelos de lenguaje (LLMs) sin costo adicional. Investigadores del Scaling Intelligence Lab de la Universidad de Stanford han presentado el framework Archon, el cual utiliza un algoritmo de búsqueda de arquitectura en tiempo de inferencia (ITAS) para mejorar el rendimiento de los LLMs sin necesidad de entrenamiento adicional.

Lo destacable de Archon es que es modelo agnóstico, de código abierto y diseñado para ser plug-and-play tanto para modelos grandes como pequeños. Esta herramienta podría ser de gran utilidad para los desarrolladores que buscan diseñar sistemas de inteligencia artificial utilizando múltiples técnicas de tiempo de inferencia para acelerar la determinación de respuestas.

Según los investigadores, el marco Archon automáticamente diseña arquitecturas que mejoran la generalización de tareas, permitiendo que los modelos realicen tareas más allá de aquellas para las que fueron entrenados inicialmente. Esto es un avance significativo en el campo de los LLMs.

A través de pruebas de referencia como MT-Bench, Arena-Hard-Auto, Alpaca-2.0 Eval, MixEval, MixEval Hard, MATH y CodeContests, Archon superó a GPT-4o y Claude 3.5 Sonnet en un 15.1% en rendimiento. Incluso frente a LLMs de código abierto, Archon logró superarlos en un 11.2%.

El marco de Archon está compuesto por varios componentes, entre los que se incluyen el Generador, el Fusor, el Clasificador, el Crítico, el Verificador y el Generador y Evaluador de Pruebas Unitarias. Estos componentes trabajan en conjunto para mejorar la calidad de las respuestas de los LLMs de manera rápida y eficiente, sin necesidad de un ajuste fino adicional.

A pesar de sus numerosos beneficios, Archon presenta ciertas limitaciones. Funciona mejor con LLMs de 70 mil millones de parámetros o más, como el Code Llama 70B de Meta, lo que dificulta su aplicación en la mayoría de los LLMs actuales. Además, su eficacia se ve reducida significativamente en modelos más pequeños, debido a sus capacidades limitadas para seguir instrucciones.

El equipo detrás de Archon señala que este marco no es ideal para tareas que requieran la latencia de una sola llamada de LLM, como en el caso de los chatbots. Sin embargo, destaca su potencial para mejorar el rendimiento en tareas más complejas como la resolución de ecuaciones, la programación o los problemas de servicio al cliente complicados. A pesar de estas limitaciones, los investigadores están optimistas sobre el potencial de Archon para acelerar el desarrollo de modelos de alto rendimiento sin requerir más recursos de inferencia y entrenamiento.

Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Compartir
Publicado por
Redacción - El Semanal

Entradas recientes

Oso con crías ataca a hombre tras ingresar a casa en Colorado.

Un hombre en Colorado tuvo un encuentro aterrador con una osa y sus tres crías…

18 mins hace

Vinicius Jr fuera de Brasil por lesión en Real Madrid: baja importante para Eliminatorias 2026.

En las últimas horas, el Real Madrid emitió un parte médico que confirmó las peores…

37 mins hace

Colombia fusiona sabores con ganado vacuno y porcino proveniente de España.

La gastronomía es mucho más que una simple cuestión biológica, es un placer que compartimos…

39 mins hace

Jefe de ayuda en desastres de EE.UU. critica falsas afirmaciones sobre respuesta a Helene como una «narrativa verdaderamente peligrosa».

El jefe de respuesta a desastres de EE. UU. critica las afirmaciones falsas sobre la…

43 mins hace

Desafortunadas lesiones de Weah, Balogun y Cardoso afectarán debut de Pochettino.

El entrenador de la selección nacional de Estados Unidos, Mauricio Pochettino, enfrentará sus primeros partidos…

1 hora hace

Ermedin Demirovic iguala encuentro Stuttgart vs Hoffenheim en Bundesliga.

El partido entre Stuttgart y Hoffenheim en la Bundesliga 2024-2025 terminó en empate 1-1, con…

1 hora hace