OpenAI presenta nuevo modelo de IA con rendimiento digno de doctorado.

OpenAI lanza su nuevo modelo de inteligencia artificial o1 con un rendimiento a nivel de doctorado

Desde el lanzamiento del potente modelo de lenguaje grande de OpenAI (LLM) GPT-4 en marzo de 2023, hace 18 meses, los usuarios y desarrolladores han estado preguntándose cuándo la empresa que inició la moda de la IA generativa en Silicon Valley y en todo el mundo lanzaría la próxima versión, presumiblemente llamada GPT-5.

Sin embargo, resulta que la serie GPT está siendo superada en este momento por toda una nueva familia de modelos.

Hoy, tras meses de rumores e informes que se intensificaron en los últimos días, OpenAI anunció su familia de modelos de IA «o1» que comienza con dos modelos: o1-preview y o1-mini, los cuales la compañía afirma que están diseñados para «razonar a través de tareas complejas y resolver problemas más difíciles» que los modelos de la serie GPT.

Ambos modelos están disponibles hoy para los usuarios de ChatGPT Plus, pero inicialmente están limitados a 30 mensajes por semana para o1-preview y 50 para o1-mini.

Sin embargo, OpenAI también advierte que «Como un modelo temprano, aún no tiene muchas de las características que hacen útil a ChatGPT, como buscar en la web información y subir archivos e imágenes. Para muchos casos comunes, GPT-4o será más capaz a corto plazo”.

De hecho, nuestras pruebas iniciales tratando de usarlo para crear una imagen para este artículo encontraron que no podía. En el sitio web de la plataforma de API de OpenAI, la compañía aclara que en su estado beta, la familia de modelos admite «solo texto, las imágenes no son compatibles».

Lo que o1 hace mejor que GPT

OpenAI afirma que su nueva serie o1 es particularmente adecuada para usuarios que abordan problemas complejos en campos como la ciencia, la salud y la tecnología.

OpenAI visualiza que los modelos se usarán para una amplia gama de aplicaciones, desde ayudar a los físicos a generar fórmulas matemáticas para la óptica cuántica hasta asistir a los investigadores de la salud en la anotación de datos de secuenciación celular.

Los desarrolladores también encontrarán que el modelo o1-mini es eficaz para construir y ejecutar flujos de trabajo de varios pasos, depurar código y resolver desafíos de programación de manera eficiente.

o1-preview se desempeña a niveles de doctorado

El modelo o1-preview está diseñado para manejar tareas desafiantes dedicando más tiempo a pensar y refinar sus respuestas, similar a cómo una persona abordaría un problema complejo.

En pruebas, este enfoque ha permitido que el modelo se desempeñe a un nivel cercano al de estudiantes de doctorado en áreas como física, química y biología.

Además, el modelo o1-preview sobresale en codificación, clasificándose en el percentil 89 en competiciones de Codeforces, mostrando su capacidad para manejar flujos de trabajo de varios pasos, depurar código complejo y generar soluciones precisas.

En tareas de referencia como el examen de calificación de la Olimpiada Internacional de Matemáticas (IMO), o1-preview demostró su destreza al resolver el 83% de los problemas, una mejora significativa sobre la tasa de éxito del 13% de su predecesor, GPT-4o.

Ya está disponible para su uso en ChatGPT por usuarios de Plus y Team, con acceso de Enterprise y Edu la próxima semana. Los modelos también están disponibles a través de la API de OpenAI para desarrolladores que califiquen para el uso de API de nivel 5, aunque se aplicarán límites iniciales de tasa.

o1-mini es menos potente pero un 80% más barato

Junto con o1-preview, OpenAI también ha lanzado el modelo o1-mini, una versión más simplificada diseñada para ofrecer capacidades de razonamiento más rápidas y económicas.

Si bien está optimizado principalmente para tareas de codificación y STEM, o1-mini aún ofrece un rendimiento sólido, especialmente en matemáticas y programación.

En la prueba de matemáticas IMO, o1-mini obtuvo un 70%, casi igualando el 74% de o1-preview, al tiempo que ofrece un costo de inferencia significativamente menor. También se desempeñó de manera competitiva en evaluaciones de codificación, logrando una puntuación Elo de 1650 en Codeforces, posicionándolo entre el 86% superior de los programadores.

Con una etiqueta de precio un 80% más baja en comparación con o1-preview, o1-mini está dirigido a desarrolladores e investigadores que requieren capacidades de razonamiento pero que no necesitan el conocimiento más amplio que ofrece el modelo o1-preview más avanzado.

Esta solución rentable también estará disponible para usuarios de ChatGPT Plus, Team, Enterprise y Edu, con planes para extender el acceso a los usuarios de ChatGPT Free en el futuro.

Mejoras en seguridad y protección

En línea con el compromiso de OpenAI con la seguridad, ambos modelos incorporan un nuevo enfoque de entrenamiento de seguridad que mejora su capacidad para seguir pautas de seguridad y alineación.

OpenAI destaca que o1-preview obtuvo una impresionante puntuación de 84 en una de sus pruebas de jailbreaking más difíciles, una mejora significativa sobre la puntuación de 22 de GPT-4o en este aspecto. La capacidad de razonar sobre las reglas de seguridad en contexto permite a estos modelos manejar mejor las solicitudes inseguras y evitar generar contenido inapropiado.

Como parte de los esfuerzos de seguridad más amplios, OpenAI ha firmado acuerdos con los Institutos de Seguridad de IA de EE. UU. y el Reino Unido.

Estas asociaciones incluyen la concesión de acceso temprano a una versión de investigación de los modelos o1 para ayudar en la evaluación y prueba de futuros sistemas de IA.

El trabajo de seguridad de OpenAI también incluye una gobernanza interna integral y colaboración con el gobierno federal, reforzada con pruebas regulares, evaluaciones de penetración y supervisión a nivel de comité de Seguridad y Protección de la empresa.

¿Qué sigue para la serie o1 de OpenAI?

Aunque los modelos o1-preview y o1-mini son herramientas poderosas para el razonamiento y la resolución de problemas, OpenAI reconoce que esto es solo el comienzo.

La compañía planea actualizar y mejorar regularmente estos modelos, incluida la adición de características como navegación, carga de archivos e imágenes y llamadas a funciones, que actualmente no están disponibles en la versión de API.

Mirando hacia el futuro, OpenAI continuará desarrollando tanto sus series GPT como o1, ampliando aún más las capacidades de la IA en diversos campos. Los usuarios pueden esperar avances continuos a medida que la empresa trabaja para aumentar la utilidad y accesibilidad de estos modelos en diferentes aplicaciones.

¿Qué opinas?

120 Votos
Upvote Downvote

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Intento de captura policial del sospechoso de triple apuñalamiento.

Lampe defiende su honor tras polémico gol de Vargas en Selecciones Nacionales.