in

Nuevo modelo de IA mejora uniformidad en empresas con enfoque único.

Un reciente intercambio en X (anteriormente Twitter) entre el profesor de Wharton Ethan Mollick y Andrej Karpathy, ex director de IA en Tesla y cofundador de OpenAI, ha puesto de manifiesto algo fascinante y fundamental: muchos de los modelos de IA generativa de primera línea actualmente en circulación, incluidos los de OpenAI, Anthropic y Google, exhiben una similitud sorprendente en su tono, lo que plantea la pregunta: ¿por qué los modelos de lenguaje de gran tamaño (LLMs) no solo convergen en cuanto a habilidades técnicas, sino también en personalidad?

El debate posterior señaló una característica común que podría estar impulsando la tendencia hacia la convergencia de resultados: el Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF), una técnica en la que los modelos de IA se ajustan en función de las evaluaciones proporcionadas por entrenadores humanos.

En medio de esta discusión sobre el papel del RLHF en la similitud de los resultados, los recientes anuncios de Inflection AI sobre Inflection 3.0 y una API comercial podrían ofrecer una dirección prometedora para abordar estos desafíos. Han introducido un enfoque novedoso en RLHF, destinado a hacer que los modelos generativos no solo sean consistentes, sino también distintivamente empáticos.

Con su incursión en el espacio empresarial, los creadores de la colección de modelos Pi aprovechan el RLHF de una manera más matizada, desde esfuerzos deliberados para mejorar los modelos de ajuste fino hasta una plataforma propietaria que incorpora la retroalimentación de los empleados para adaptar las salidas de IA generativa a la cultura organizativa. La estrategia tiene como objetivo hacer que los modelos de Inflection AI sean aliados culturales reales en lugar de simples chatbots genéricos, proporcionando a las empresas un sistema de IA más humano y alineado que se destaque del resto.

En medio de esta convergencia, Inflection AI, los creadores del modelo Pi, están abriendo un camino diferente. Con el reciente lanzamiento de Inflection for Enterprise, Inflection AI tiene como objetivo hacer de la inteligencia emocional, denominada «EQ», una característica fundamental para sus clientes empresariales.

La empresa afirma que su enfoque único en RLHF la distingue. En lugar de basarse en el etiquetado de datos anónimos, la empresa buscó la retroalimentación de 26,000 maestros de escuela y profesores universitarios para ayudar en el proceso de ajuste fino a través de una plataforma de retroalimentación propia. Además, la plataforma permite a los clientes empresariales ejecutar el aprendizaje por refuerzo con la retroalimentación de los empleados. Esto permite ajustar posteriormente el modelo a la voz y el estilo únicos de la empresa del cliente.

El enfoque de Inflection AI promete que las empresas «posean» su inteligencia, es decir, un modelo local ajustado con datos propietarios que se gestionan de forma segura en sus propios sistemas. Este es un cambio notable con respecto a los modelos de IA centrados en la nube con los que muchas empresas están familiarizadas, una configuración que Inflection cree que mejorará la seguridad y fomentará una mayor alineación entre las salidas de IA y la forma en que las personas la utilizan en el trabajo.

RLHF se ha convertido en el eje del desarrollo de la IA generativa, en gran parte porque permite a las empresas dar forma a las respuestas para que sean más útiles, coherentes y menos propensas a errores peligrosos. El uso de RLHF por parte de OpenAI fue fundamental para hacer que herramientas como ChatGPT fueran atractivas y generalmente confiables para los usuarios. RLHF ayuda a alinear el comportamiento del modelo con las expectativas humanas, lo que lo hace más atractivo y reduce las salidas no deseadas.

Sin embargo, RLHF no está exento de inconvenientes. RLHF se ofreció rápidamente como una razón que contribuye a la convergencia de las salidas de los modelos, lo que potencialmente lleva a una pérdida de características únicas y hace que los modelos sean cada vez más similares. Aunque la alineación ofrece consistencia, también crea un desafío para la diferenciación.

Anteriormente, Karpathy mismo señaló algunas de las limitaciones inherentes al RLHF. Lo comparó con un juego de verificación de ambiente y destacó que no proporciona una «recompensa real» similar a los juegos competitivos como AlphaGo. En cambio, RLHF optimiza una resonancia emocional que es en última instancia subjetiva y puede no ser adecuada para tareas prácticas o complejas.

Para mitigar algunas de estas limitaciones de RLHF, Inflection AI ha emprendido una estrategia de entrenamiento más matizada. No solo implementa una mejorada RLHF, también ha dado pasos hacia capacidades de IA agentes, que ha abreviado como AQ (Cociente de Acción). Como White describió en una entrevista reciente, los objetivos empresariales de Inflection AI implican permitir que los modelos no solo entiendan y empaticen, sino también tomen acciones significativas en nombre de los usuarios, desde enviar correos electrónicos de seguimiento hasta ayudar en la resolución de problemas en tiempo real.

Si bien el enfoque de Inflection AI es ciertamente innovador, hay posibles desventajas a considerar. Su ventana de contexto de 8K tokens utilizada para la inferencia es más pequeña de lo que emplean muchos modelos de gama alta, y el rendimiento de sus modelos más recientes no ha sido evaluado. A pesar de los planes ambiciosos, los modelos de Inflection AI pueden no alcanzar el nivel de rendimiento deseado en aplicaciones del mundo real.

No obstante, el cambio de EQ a AQ podría marcar una evolución crítica en el desarrollo de la IA generativa, especialmente para los clientes empresariales que buscan aprovechar la automatización tanto para tareas cognitivas como operativas. No se trata solo de hablar empáticamente con los clientes o empleados; Inflection AI espera que Inflection 3.0 también ejecute tareas que traduzcan la empatía en acción. La asociación de Inflection con plataformas de automatización como UiPath para proporcionar esta «IA agente» refuerza aún más su estrategia para destacarse en un mercado cada vez más saturado.

Navegando en un mundo post-Suleyman

Inflection AI ha experimentado cambios significativos internos en el último año. La partida del CEO Mustafa Suleyman en la «contratación» de Microsoft, junto con una parte considerable del equipo, sembró dudas sobre la trayectoria de la empresa. Sin embargo, el nombramiento de White como CEO y un equipo directivo renovado ha marcado un nuevo rumbo para la organización.

Esta «refundación» centrada en el uso empresarial de la IA emocional tiene como objetivo proporcionar experiencias de IA personalizadas y profundamente integradas en lugar de soluciones genéricas de chatbot.

La única aproximación de Inflection AI con Pi está ganando terreno más allá del espacio empresarial, especialmente entre los usuarios en plataformas como Reddit. La comunidad de Pi ha hablado sobre sus experiencias, compartiendo anécdotas positivas y discusiones sobre las respuestas reflexivas y empáticas de Pi.

Esta popularidad grassroots demuestra que Inflection AI podría estar en algo significativo. Al centrarse en la inteligencia emocional y la empatía, Inflection no solo está creando IA que ayuda, sino también IA que conecta con las personas, ya sea en entornos empresariales o como asistentes personales. Este nivel de compromiso del usuario sugiere que su enfoque en EQ podría ser la clave para distinguirse en un panorama donde otros LLMs corren el riesgo de fundirse.

¿Qué sigue para Inflection AI?

En adelante, el enfoque de Inflection AI en características posteriores al entrenamiento como Generación con Recuperación Aumentada (RAG) y flujos de trabajo agentes tiene como objetivo mantener su tecnología a la vanguardia de las necesidades empresariales. Inflection AI dice que el objetivo final es impulsar una era post-GUI, donde la IA no solo responda a comandos sino que también asista activamente con integraciones fluidas en varios sistemas empresariales.

Todavía queda por verse si el enfoque innovador de Inflection AI mejorará significativamente la similitud de las salidas. Sin embargo, si las ideas innovadoras de White y su equipo dan resultado, EQ podría surgir como una métrica fundamental para evaluar la eficacia de la tecnología generativa de su empresa.

¿Qué opinas?

120 Votos
Upvote Downvote

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

One Comment

Estadounidense condenado en Rusia por su participación en conflicto ucraniano.

Descubren mejoras significativas en la base BECARSIR Magsafe