Mistral presenta Codestral Mamba para una generación de código más rápida y extensa.

La compañía francesa Mistral ha lanzado hoy dos nuevos modelos dentro de su creciente familia de grandes modelos de lenguaje (LLMs) basados en la nueva arquitectura conocida como Mamba, desarrollada por otros investigadores a finales del año pasado.

Mamba busca mejorar la eficiencia de la arquitectura transformer utilizada por la mayoría de los principales LLMs al simplificar sus mecanismos de atención. Los modelos basados en Mamba, a diferencia de los basados en transformer, podrían tener tiempos de inferencia más rápidos y un contexto más largo. Otras empresas y desarrolladores, como AI21, han lanzado nuevos modelos de IA basados en esta arquitectura.

Utilizando esta nueva arquitectura, el modelo de Mistral llamado Codestral Mamba 7B ofrece un tiempo de respuesta rápido incluso con textos de entrada más largos. Codestral Mamba funciona bien para casos de uso relacionados con la productividad en el código, especialmente para proyectos de codificación locales.

Mistral probó el modelo, que será de uso gratuito en la API de Mistral, manejando entradas de hasta 256,000 tokens, el doble que el GPT-4o de OpenAI.

En pruebas de referencia, Mistral demostró que Codestral Mamba superó a modelos de código de código abierto rivales como CodeLlama 7B, CodeGemma-1.17B y DeepSeek en pruebas de HumanEval.

Los desarrolladores pueden modificar e implementar Codestral Mamba desde su repositorio en GitHub y a través de HuggingFace. Estará disponible bajo una licencia de código abierto Apache 2.0.

Mistral afirmó que la versión anterior de Codestral superó a otros generadores de código como CodeLlama 70B y DeepSeek Coder 33B.

La generación de código y los asistentes de codificación se han convertido en aplicaciones ampliamente utilizadas para los modelos de IA, con plataformas como Copilot de GitHub, impulsado por OpenAI, CodeWhisperer de Amazon y Codenium ganando popularidad.

Por otro lado, el segundo lanzamiento de Mistral es Mathstral 7B, un modelo de IA diseñado específicamente para razonamiento relacionado con matemáticas y descubrimientos científicos. Mistral desarrolló Mathstral en colaboración con Project Numina.

Mathstral tiene una ventana de contexto de 32K y estará bajo la licencia de código abierto Apache 2.0. Mistral afirmó que el modelo superó a todos los demás diseñados para el razonamiento matemático y puede lograr «resultados significativamente mejores» en comparación con computaciones de tiempo de inferencia. Los usuarios pueden utilizarlo tal cual o ajustar el modelo.

Por último, Mistral, que tiende a ofrecer sus modelos en un sistema de código abierto, ha estado compitiendo constantemente contra otros desarrolladores de IA como OpenAI y Anthropic. Recientemente recaudó $640 millones en financiación de la serie B, lo que llevó su valoración a cerca de $6 mil millones. La compañía también recibió inversiones de gigantes tecnológicos como Microsoft y IBM.

Mistral presenta Codestral Mamba para una generación de código más rápida y extensa.

¿Qué opinas?

Escrito por Redacción - El Semanal

Deja una respuestaCancelar la respuesta

Claves esenciales para formar y retener el talento en tu empresa

Claves de los empleados que destacan en formación profesional

¡Cuidado! Estos síntomas te indican que podrías tener la hemoglobina baja

Ampliación del servicio de Comunicaciones en Rico con iPhone, llega a más operadoras con la versión beta 3 de iOS 18.

Tone de Kai Cenat y AMP lanza su línea en Target ahora

La familia de Hulk Hogan: conoce a su esposa e hijos

Qualcomm presenta plataforma Snapdragon Elite para automóviles de última generación

Una sorpresa para los fanáticos: la serie se estrena más pronto de lo previsto

Alcalde de París nada en el Sena para demostrar limpieza ante los Juegos Olímpicos.

Carney advierte que el T-MEC no soluciona todos los conflictos comerciales con EE.UU.

¿Qué opinas?

Deja una respuestaCancelar la respuesta

Log In

With social network:

Or with username:

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections

Suscríbete a El Semanal