Mistral sorprende con su nuevo modelo abierto Mistral Large 2, desafiando a Llama 3.1

La competencia en el campo de la inteligencia artificial está en pleno auge con el lanzamiento del nuevo modelo de código abierto Mistral Large 2, de la empresa francesa Mistral, que viene a desafiar al Llama 3.1 de Meta.

Este nuevo modelo de Mistral cuenta con 123 mil millones de parámetros y se encuentra disponible para uso no comercial en investigaciones abiertas, lo que permite a terceros ajustarlo a sus necesidades. Para aplicaciones comerciales de nivel empresarial, se requiere una licencia separada de la empresa.

Aunque Mistral Large 2 tiene menos parámetros que el Llama 3.1, que cuenta con 405 mil millones, se aproxima en rendimiento a este último. Ofrece capacidades avanzadas multilingües con mejoras en razonamiento, generación de código y matemáticas. Se le considera un modelo de clase GPT-4 con rendimiento comparable al GPT-4o, Llama 3.1-405 y Claude 3.5 Sonnet en varios benchmarks.

Este avance no es un hecho aislado, ya que Mistral ha estado posicionándose agresivamente en el mercado de IA, recaudando grandes sumas de dinero, lanzando modelos específicos para tareas particulares y colaborando con gigantes de la industria para expandir su alcance.

Mistral Large 2 ofrece una ventana de contexto mayor de 128,000 tokens, lo que le permite tener una comprensión más refinada de la gramática y el contexto cultural en varios idiomas, incluidos el inglés, francés, español, alemán e italiano. Además, brinda soporte para docenas de idiomas adicionales como portugués, árabe, hindi, ruso, chino, japonés y coreano.

En el ámbito de la generación de código, Mistral Large 2 ha mejorado significativamente respecto a su predecesor, siendo capaz de generar código en más de 80 lenguajes de programación con gran precisión. También ha destacado en evaluaciones de generación de código y matemáticas, ocupando el segundo puesto en varios benchmarks.

Uno de los enfoques clave de Mistral ha sido minimizar las alucinaciones del modelo y mejorar su capacidad para seguir instrucciones. Si el modelo no cuenta con suficiente información para respaldar una respuesta, simplemente lo comunicará al usuario, garantizando transparencia. Además, ha sido ajustado para proporcionar respuestas concisas y al punto, lo que puede resultar útil en entornos empresariales.

Actualmente, Mistral Large 2 está disponible a través de su plataforma de API y en plataformas en la nube como Google Vertex AI, Amazon Bedrock, Azure AI Studio y IBM WatsonX. Los usuarios también pueden probarlo a través del chatbot de la empresa para ver su funcionamiento en la práctica.

En resumen, Mistral Large 2 emerge como una propuesta sólida en el campo de la inteligencia artificial, combinando rendimiento avanzado con capacidades multilingües y mejoras significativas en generación de código y matemáticas. Su llegada supone un hito en la evolución de los modelos de IA y promete ser una herramienta valiosa para diversas aplicaciones.

¿Qué opinas?

120 Votos
Upvote Downvote

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Ancianos del hogar son evacuados por incendios en Williams Lake

Autoridades locales de Lanzarote se reúnen para debatir temáticas de interés comunitario.