La comunidad de inteligencia artificial de código abierto es un campo en constante evolución y, en ocasiones, complicado de seguir, aun para aquellos que trabajan en él o lo cubren, como es el caso de los periodistas de El Semanal. La amplia accesibilidad de los nuevos modelos de inteligencia artificial de código abierto y la permisividad de sus licencias hacen que sea más sencillo para los desarrolladores emprendedores tomarlos y mejorarlos que con los modelos propietarios.
En este sentido, apenas unos días después de que se reclamara el liderazgo del último modelo, ya parece haber un nuevo líder en el ámbito de los modelos de inteligencia artificial de código abierto.
DeepSeek, la versión de inteligencia artificial de la gestora de fondos chinos High-Flyer Capital Management, ha lanzado oficialmente su último modelo, DeepSeek-V2.5, una versión mejorada que integra las capacidades de sus predecesores, DeepSeek-V2-0628 y DeepSeek-Coder-V2-0724.
Este nuevo lanzamiento, emitido el 6 de septiembre de 2024, combina tanto el procesamiento de lenguaje general como las funcionalidades de codificación en un único modelo potente.
Disponible ahora en Hugging Face, el modelo ofrece a los usuarios un acceso fluido a través de la web y API, y parece ser el modelo de lenguaje grande más avanzado actualmente disponible en el panorama de código abierto, según observaciones y pruebas de investigadores de terceros.
El elogio para DeepSeek-V2.5 sigue a una controversia más reciente en torno a Reflection 70B de HyperWrite, cuyo cofundador y CEO Matt Shumer afirmó el 5 de septiembre que era «el principal modelo de inteligencia artificial de código abierto del mundo», según sus pruebas internas, solo para ver cuestionadas esas afirmaciones por investigadores independientes y la comunidad más amplia de investigación en inteligencia artificial, que hasta ahora no ha podido reproducir los resultados declarados.
Optimizado para varias tareas, incluyendo escritura, seguimiento de instrucciones y codificación avanzada, DeepSeek-V2.5 se destaca en una variedad de métricas críticas, demostrando su superioridad tanto en procesamiento de lenguaje natural (NLP) como en tareas de codificación. Este nuevo modelo introduce capacidades de llamada de funciones, lo que le permite interactuar de forma más efectiva con herramientas externas y ampliar su aplicación en campos como el reporte del clima en tiempo real, servicios de traducción y tareas computacionales como escribir algoritmos o fragmentos de código.
Con DeepSeek-V2.5, DeepSeek-AI continúa avanzando en la accesibilidad y el potencial de la inteligencia artificial, consolidando su papel como líder en el campo de los modelos de gran escala.
GIPHY App Key not set. Please check settings