El Semanal revela las claves para aprovechar los modelos o1 de OpenAI

La nueva familia de modelos de OpenAI, o1, promete ser más potente y mejor razonamiento que los modelos anteriores. Utilizar GPT-o1 será ligeramente diferente que el uso de GPT-4 o incluso GPT-4o. Dado que este modelo tiene más capacidades de razonamiento, algunos métodos de ingeniería de solicitudes regulares no funcionarán tan bien. Modelos anteriores necesitaban más orientación, y las personas aprovechaban ventanas de contexto más largas para proporcionarles más instrucciones.

De acuerdo con la documentación de la API de OpenAI, los modelos o1 «funcionan mejor con solicitudes directas y sencillas». Sin embargo, técnicas como instruir al modelo y solicitar ráfagas «pueden no mejorar el rendimiento y a veces dificultan el proceso».

OpenAI aconsejó a los usuarios de o1 que consideren cuatro cosas al solicitar a los nuevos modelos:

1. Mantener las solicitudes simples y directas y no guiar demasiado al modelo porque entiende bien las instrucciones.
2. Evitar las solicitudes encadenadas de pensamiento ya que los modelos o1 ya razonan internamente.
3. Utilizar delimitadores como comillas triples, etiquetas XML y títulos de secciones para que el modelo pueda tener claridad sobre qué secciones está interpretando.
4. Limitar el contexto adicional para la generación aumentada de recuperación (RAG) porque OpenAI dijo que agregar más contexto o documentos cuando se utilizan los modelos para tareas de RAG podría complicar en exceso su respuesta.

El consejo de OpenAI para o1 difiere en gran medida de las sugerencias que dio a los usuarios de sus modelos anteriores. Anteriormente, la empresa sugería ser increíblemente específica, incluir detalles y dar instrucciones paso a paso, o1 hará un mejor «pensamiento» por sí mismo sobre cómo resolver las consultas.

Ethan Mollick, profesor de la Escuela de Negocios de Wharton en la Universidad de Pensilvania, dijo en su blog «One Useful Thing» que su experiencia como usuario temprano de o1 mostró que funciona mejor en tareas que requieren planificación, donde el modelo concluye cómo resolver los problemas por sí mismo.

La ingeniería de solicitudes se convirtió en un método para que las personas se centraran en aspectos específicos y obtuvieran las respuestas que quieren de un modelo de IA. No solo se ha convertido en una habilidad importante, sino también en una categoría de trabajo en aumento.

Otros desarrolladores de IA lanzaron herramientas para facilitar la creación de solicitudes al diseñar aplicaciones de IA. Google lanzó Prompt Poet, construido con la ayuda de Character.ai, que integra fuentes de datos externas para que las respuestas sean más relevantes.

Aunque o1 es aún nuevo y las personas todavía están descubriendo exactamente cómo usarlo (incluyéndome a mí, que aún no ha descubierto mi primera solicitud), algunos usuarios de redes sociales predicen que las personas tendrán que cambiar la forma en que abordan la solicitud de ChatGPT.

¿Qué opinas?

120 Votos
Upvote Downvote

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Un oso de anteojos nace y alegra comunidad agrícola en Perú

Empleados de Loblaw en Calgary usan cámaras corporales para seguridad.