Emprendimiento e Innovación

El innovador sistema de DeepMind demuestra la capacidad de las superinteligencias para aprender de sus errores.

Google DeepMind ha presentado una nueva técnica llamada Self-Correction via Reinforcement Learning (SCoRe) que promete mejorar significativamente la capacidad de autocorrección de los modelos de lenguaje de gran escala (LLMs). Esta técnica se basa en el uso de datos generados por el propio modelo para mejorar sus respuestas, sin necesidad de retroalimentación externa.

Los LLMs han demostrado ser eficaces en tareas complejas, pero a menudo fallan en la primera respuesta correcta. Por ello, la autocorrección se vuelve fundamental para mejorar su desempeño. Hasta ahora, los intentos de autocorrección se han basado en el diseño de las preguntas o en el ajuste específico de los modelos, lo que limita su efectividad en situaciones del mundo real.

SCoRe busca superar estas limitaciones mediante el uso de aprendizaje por refuerzo. Este enfoque entrena a un solo modelo para que genere respuestas y corrija sus propios errores, sin depender de retroalimentación externa. Además, SCoRe se centra en evitar que el modelo se enfoque solo en la respuesta final, ignorando los pasos intermedios necesarios para la autocorrección.

Los investigadores de DeepMind han evaluado SCoRe en tareas de matemáticas y programación, logrando mejoras significativas en la capacidad de autocorrección de los modelos Gemini 1.0 Pro y 1.5 Flash. Por ejemplo, en el benchmark MATH, SCoRe logró un aumento absoluto del 15,6% en autocorrección, superando a otros métodos existentes.

Uno de los aspectos más destacados de SCoRe es su capacidad para reducir los casos en los que el modelo cambia incorrectamente una respuesta correcta a una incorrecta durante el proceso de autocorrección, lo que indica que aprendió a aplicar correcciones solo cuando eran necesarias.

Además, SCoRe se ha mostrado altamente eficiente cuando se combina con estrategias de escalado en tiempo de inferencia, como la autoconsistencia. Al asignar el mismo presupuesto de inferencia a través de múltiples rondas de corrección, SCoRe habilita mayores mejoras de rendimiento.

Si bien el estudio se centra principalmente en tareas de codificación y razonamiento, los investigadores creen que SCoRe puede ser beneficioso para otras aplicaciones. Esta técnica no solo mejora el desempeño de los LLMs, sino que también destaca la importancia de enseñar a los modelos a razonar y corregirse a sí mismos, en lugar de simplemente mapear entradas a salidas.

En resumen, SCoRe representa un avance significativo en la capacidad de autocorrección de los modelos de lenguaje, abriendo nuevas posibilidades para mejorar su robustez y confiabilidad en diversas aplicaciones.

Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Entradas recientes

Oso con crías ataca a hombre tras ingresar a casa en Colorado.

Un hombre en Colorado tuvo un encuentro aterrador con una osa y sus tres crías…

13 mins hace

Vinicius Jr fuera de Brasil por lesión en Real Madrid: baja importante para Eliminatorias 2026.

En las últimas horas, el Real Madrid emitió un parte médico que confirmó las peores…

32 mins hace

Colombia fusiona sabores con ganado vacuno y porcino proveniente de España.

La gastronomía es mucho más que una simple cuestión biológica, es un placer que compartimos…

34 mins hace

Jefe de ayuda en desastres de EE.UU. critica falsas afirmaciones sobre respuesta a Helene como una «narrativa verdaderamente peligrosa».

El jefe de respuesta a desastres de EE. UU. critica las afirmaciones falsas sobre la…

38 mins hace

Desafortunadas lesiones de Weah, Balogun y Cardoso afectarán debut de Pochettino.

El entrenador de la selección nacional de Estados Unidos, Mauricio Pochettino, enfrentará sus primeros partidos…

1 hora hace

Ermedin Demirovic iguala encuentro Stuttgart vs Hoffenheim en Bundesliga.

El partido entre Stuttgart y Hoffenheim en la Bundesliga 2024-2025 terminó en empate 1-1, con…

1 hora hace