El mundo de la inteligencia artificial tiene un nuevo exponente de peso: Matt Shumer, cofundador y CEO de la startup de escritura AI HyperWrite, ha presentado hoy Reflection 70B, un nuevo modelo de lenguaje de gran tamaño basado en Llama 3.1-70B Instruct de Meta y que emplea una novedosa técnica de autocorrección de errores, destacando por su rendimiento superior en pruebas de terceros.
Reflection-70B ha sido ampliamente probado en diversos benchmarks, como MMLU y HumanEval, utilizando el LLM Decontaminator de LMSys para garantizar resultados libres de contaminación. Estas pruebas muestran que Reflection supera consistentemente a los modelos de la serie Llama de Meta y compite de igual a igual con los modelos comerciales más destacados.
Lo que distingue a Reflection 70B es su capacidad única de identificación y corrección de errores. Con una técnica denominada Reflection-Tuning, el modelo es capaz de detectar y corregir sus propios errores antes de presentar una respuesta final al usuario.
La presentación de varios tokens especiales para razonamiento y corrección de errores hace que sea más fácil para los usuarios interactuar con el modelo de manera estructurada. Durante la inferencia, el modelo muestra su razonamiento dentro de etiquetas especiales, permitiendo correcciones en tiempo real si detecta algún error.
La demostración en el sitio web de pruebas incluye sugerencias de prompts para que el usuario interactúe con Reflection 70B, planteándole problemas simples que muchos otros modelos de IA, incluyendo los propietarios líderes, suelen fallar en responder de manera consistente.
Este modelo resulta especialmente útil para tareas que requieren alta precisión, ya que separa el razonamiento en pasos distintos para mejorar la precisión. Está disponible para su descarga a través del repositorio de código de IA Hugging Face, y el acceso a la API estará disponible más adelante en el día a través del proveedor de servicios GPU Hyperbolic Labs.
Pero esto es solo el principio para la serie Reflection. Shumer ha anunciado que la próxima semana estará disponible un modelo aún más grande, Reflection 405B, que se espera supere incluso a los principales modelos de código cerrado del mercado actual.
Además, HyperWrite está trabajando en la integración del modelo Reflection 70B en su producto principal de asistente de escritura AI. Se exploran diversas formas de integrar el modelo en HyperWrite, con el objetivo de proporcionar más información al respecto próximamente.
En definitiva, el lanzamiento de Reflection 70B marca un hito significativo para la IA de código abierto, brindando a desarrolladores e investigadores el acceso a una herramienta poderosa que rivaliza con las capacidades de los modelos propietarios. A medida que la IA evoluciona, el enfoque único de Reflection en el razonamiento y la corrección de errores podría marcar un nuevo estándar en lo que los modelos de código abierto pueden lograr.
GIPHY App Key not set. Please check settings