OpenAI integra ajuste fino en su nueva versión del GPT.

OpenAI anuncia nuevas capacidades de ajuste fino para GPT-4o

En una reciente noticia, OpenAI ha comunicado que permitirá a desarrolladores de software de terceros ajustar fino -o modificar el comportamiento de- versiones personalizadas de su nuevo gran modelo multimodal (LMM), GPT-4o, haciéndolo más adecuado para las necesidades de sus aplicaciones u organizaciones.

Esta nueva funcionalidad, conocida como ajuste fino, permite mejoras significativas con incluso conjuntos de datos pequeños, ya sea ajustando el tono, siguiendo instrucciones específicas o mejorando la precisión en tareas técnicas.

Los desarrolladores interesados en esta capacidad pueden acceder al panel de ajuste fino de OpenAI, hacer clic en «crear» y seleccionar gpt-4o-2024-08-06 dentro del menú desplegable del modelo base.

Estas noticias llegan menos de un mes después de que la compañía permitiera a los desarrolladores ajustar fino la variante más pequeña, rápida y económica del modelo, GPT-4o mini, que, sin embargo, es menos potente que el GPT-4o completo.

«Desde la codificación hasta la escritura creativa, el ajuste fino puede tener un gran impacto en el rendimiento del modelo en una variedad de dominios», señalan los miembros técnicos del personal de OpenAI, John Allard y Steven Heidel, en un artículo de blog en el sitio web oficial de la empresa. «Esto es solo el comienzo, seguiremos invirtiendo en la expansión de nuestras opciones de personalización de modelos para los desarrolladores».

La empresa destaca que los desarrolladores pueden obtener resultados sólidos con tan solo unas pocas docenas de ejemplos en sus datos de entrenamiento.

Para celebrar la nueva característica, OpenAI ofrece hasta 1 millón de tokens al día de forma gratuita para utilizar en el ajuste fino de GPT-4o para cualquier organización de terceros (cliente) hasta el 23 de septiembre de 2024.

Los tokens son representaciones numéricas de combinaciones de letras, números y palabras que representan conceptos subyacentes aprendidos por un LMM o LMM. Por lo tanto, funcionan efectivamente como el «idioma nativo» de un modelo de IA y son la medida utilizada por OpenAI y otros proveedores de modelos para determinar cuánta información está absorbiendo un modelo (entrada) o proporcionando (salida). Para ajustar fino un LMM o LMM como GPT-4o como desarrollador/cliente, es necesario convertir los datos relevantes para su organización, equipo o caso de uso individual en tokens que pueda entender, es decir, tokenizarlo, algo que las herramientas de ajuste fino de OpenAI proporcionan.

Sin embargo, esto tiene un costo: normalmente costará $25 por cada 1 millón de tokens para ajustar fino GPT-4o, mientras que ejecutar el modelo de inferencia/producción de su versión ajustada fino cuesta $3.75 por cada millón de tokens de entrada y $15 por cada millón de tokens de salida.

Para aquellos que trabajan con el modelo más pequeño GPT-4o mini, hay disponibles 2 millones de tokens de entrenamiento gratuitos diariamente hasta el 23 de septiembre.

Esta oferta se extiende a todos los desarrolladores en niveles de uso pagados, asegurando un amplio acceso a las capacidades de ajuste fino.

La iniciativa de ofrecer tokens gratuitos surge como resultado de la feroz competencia en precio que enfrenta OpenAI de otros proveedores propietarios como Google y Anthropic, así como de modelos de código abierto como el recientemente presentado Hermes 3 de Nous Research, una variante de Llama 3.1 de Meta.

Sin embargo, con OpenAI y otros modelos cerrados/proprietarios, los desarrolladores no tienen que preocuparse por alojar el modelo de inferencia o entrenarlo en sus servidores, pueden utilizar los de OpenAI para esos propósitos, o vincular sus propios servidores preferidos a la API de OpenAI.

El éxito del ajuste fino

El lanzamiento del ajuste fino de GPT-4o sigue a extensas pruebas con socios selectos, demostrando el potencial de modelos personalizados en varios dominios.

Cosine, una firma de ingeniería de software de IA, ha aprovechado el ajuste fino para lograr resultados de vanguardia del 43.8% en el benchmark SWE-bench con su agente de ingeniero de IA autónoma Genie, el más alto de cualquier modelo o producto de IA públicamente declarado hasta la fecha.

Otro caso destacado es Distyl, un socio de soluciones de IA para empresas Fortune 500, cuyo GPT-4o ajustado fino se colocó en primer lugar en el benchmark BIRD-SQL, logrando una precisión de ejecución del 71.83%.

El modelo destacó en tareas como reformulación de consultas, clasificación de intenciones, razonamiento de encadenamiento de pensamiento y autocorrección, especialmente en la generación de SQL.

Énfasis en la seguridad y privacidad de los datos

OpenAI ha reforzado que la seguridad y privacidad de los datos siguen siendo prioridades, incluso al expandir las opciones de personalización para los desarrolladores.

Los modelos ajustados fino permiten tener control total sobre los datos empresariales, sin riesgo de que las entradas o salidas se utilicen para entrenar otros modelos.

Además, la empresa ha implementado mitigaciones de seguridad en capas, incluidas evaluaciones automatizadas y monitoreo de uso, para garantizar que las aplicaciones se adhieran a las políticas de uso de OpenAI.

Sin embargo, la investigación ha demostrado que ajustar modelos fino puede hacer que se desvíen de sus protecciones y frenos, y reducir su rendimiento global. Si las organizaciones creen que vale la pena el riesgo, es algo que les corresponde decidir, sin embargo, claramente OpenAI considera que lo es y los anima a considerar el ajuste fino como una buena opción.

De hecho, al anunciar nuevas herramientas de ajuste fino para desarrolladores en abril pasado, como la creación de checkpoints basados en épocas, OpenAI afirmó en ese momento que «Creemos que en el futuro, la gran mayoría de las organizaciones desarrollarán modelos personalizados que estén personalizados para su industria, negocio o caso de uso».

El lanzamiento de nuevas capacidades de ajuste fino de GPT-4o hoy subraya el compromiso continuo de OpenAI con esa visión: un mundo en el que cada organización tenga su propio modelo de IA personalizado.

¿Qué opinas?

120 Votos
Upvote Downvote

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Illinois prohíbe el castigo físico en todas las escuelas de forma permanente

Arranca oficialmente la celebración de Whoop-Up Days en Lethbridge. ¡Momento emocionante!