Microsoft presenta ajuste fino sin servidor para su modelo de lenguaje Phi-3 pequeño
Microsoft es un importante partidario y socio de OpenAI, pero eso no significa que quiera dejar que la última empresa se lleve a cabo en el juego generativo de la IA.
Como prueba de ello, Microsoft anunció hoy una nueva forma de ajustar fino su modelo de lenguaje Phi-3 sin que los desarrolladores tengan que gestionar sus propios servidores, y de forma gratuita (inicialmente).
El ajuste fino se refiere al proceso de adaptar un modelo de IA a través de indicaciones del sistema o ajustando sus pesos subyacentes (parámetros) para hacerlo comportarse de manera diferente y más óptima para casos de uso específicos y usuarios finales, incluso añadiendo nuevas capacidades.
¿Qué es Phi-3?
La compañía presentó Phi-3, un modelo de 3 mil millones de parámetros, en abril como una opción de bajo costo y de grado empresarial para que los desarrolladores de terceros construyan nuevas aplicaciones y software. A pesar de ser considerablemente más pequeño que la mayoría de los otros modelos de lenguaje líderes, Phi-3 tuvo un rendimiento equivalente al modelo GPT-3.5 de OpenAI, según comentarios proporcionados en ese momento a VentureBeat por Sébastien Bubeck, Vicepresidente de IA generativa de Microsoft.
Phi-3 fue diseñado para ofrecer un rendimiento asequible en programación, razonamiento de sentido común y conocimientos generales. Ahora es toda una familia que consta de 6 modelos separados con diferentes números de parámetros y longitudes de contexto, variando desde 4,000 hasta 128,000 tokens de entrada, con costos que oscilan entre $0.0003 a $0.0005 USD por cada 1,000 tokens de entrada.
Sin embargo, al traducirlo al precio habitual «por millón» de tokens, va desde $0.3 a $0.9 por 1 millón de tokens para comenzar, exactamente el doble del nuevo precio mini de entrada de GPT-4o de OpenAI para la entrada y aproximadamente 1,5 veces más caro para los tokens de salida.
Phi-3 fue diseñado para ser seguro para las empresas, con salvaguardas para reducir el sesgo y la toxicidad. Aunque en un principio no había una opción sin servidor para ajustarlo fino, ahora Microsoft ha anunciado la disponibilidad para el público en general de sus «Modelos como Servicio (punto de conexión sin servidor)» en su plataforma de desarrollo de IA en Azure.
Microsoft también anunció que «Phi-3-small ahora está disponible a través de un punto de conexión sin servidor para que los desarrolladores puedan comenzar rápidamente con el desarrollo de IA sin tener que gestionar la infraestructura subyacente».
Phi-3-vision, que puede manejar entradas de imágenes, pronto estará disponible a través de un punto de conexión sin servidor, según la publicación del blog de Microsoft. No obstante, estos modelos solo están disponibles tal como están a través de la plataforma de desarrollo de IA de Azure de Microsoft. Para los desarrolladores que buscan personalizarlos, Microsoft sugiere recurrir a Phi-3-mini y Phi-3-medium, que pueden ajustarse fino con datos de terceros para crear experiencias de IA más relevantes para sus usuarios.
«Debido a su pequeña huella de cómputo, compatibilidad en la nube y en el borde, los modelos Phi-3 son ideales para el ajuste fino y mejorar el rendimiento del modelo base en una variedad de escenarios, incluido el aprendizaje de una nueva habilidad o tarea (por ejemplo, tutoría) o mejorar la consistencia y calidad de la respuesta (por ejemplo, tono o estilo de respuestas en chat/ preguntas y respuestas),» escribe la empresa.
Específicamente, Microsoft menciona que la empresa de software educativo Khan Academy ya está utilizando un Phi-3 ajustado fino para evaluar el rendimiento de su Khanmigo para Profesores impulsado por el Servicio Azure OpenAI de Microsoft.
Una nueva guerra de precios y capacidades para los desarrolladores de IA empresarial
El precio para el ajuste fino sin servidor de Phi-3-mini-4k-instruct comienza en $0.004 por 1,000 tokens ($4 por 1 millón de tokens), mientras que aún no se ha indicado el precio para el modelo median.
Si bien es una clara ventaja para los desarrolladores que desean permanecer en el ecosistema de Microsoft, también es un competidor notable para los esfuerzos de OpenAI, el propio aliado de Microsoft, para capturar desarrolladores de IA empresarial.
OpenAI anunció recientemente el ajuste fino gratuito del mini GPT-4o hasta 2 millones de tokens por día hasta el 23 de septiembre, para los usuarios de los llamados «Niveles 4 y 5» de su interfaz de programación de aplicaciones (API), o para aquellos que gasten al menos $250 o $1000 en créditos de API.
En el contexto del lanzamiento de Meta de la familia de código abierto Llama 3.1 y del nuevo modelo de Mistral Large 2 de Mistral, ambos de los cuales también se pueden ajustar fino para diferentes usos, queda claro que la carrera por ofrecer opciones de IA convincentes para el desarrollo empresarial está en pleno apogeo, y los proveedores de IA están cortejando a los desarrolladores con modelos pequeños y grandes.
GIPHY App Key not set. Please check settings