Increíble software chino genera novelas completas al instante con código abierto.

Los avances en los chatbots con inteligencia artificial (IA) han sido significativos en el último año. ChatGPT, Claudio y Géminis han logrado mantener el contexto en conversaciones más extensas y complejas, así como manejar entradas de texto cada vez más grandes. Sin embargo, una limitación importante que enfrentan es la capacidad de proporcionar respuestas que superen las 1000 palabras.

Esta restricción ha generado debates entre los usuarios, quienes se cuestionan por qué los chatbots tienen dificultades para manejar resultados extensos en una sola respuesta. La Universidad Tsinghua de Beijing ha abordado este problema y ha compartido sus hallazgos para su análisis público.

Uno de los aspectos más destacados de la investigación dirigida por Bai Yushi es la presentación de dos modelos de lenguaje a gran escala (LLM) que pueden generar respuestas de más de 10.000 palabras. Este logro es impresionante, considerando que novelas famosas como «La Metamorfosis» de Franz Kafka rondan las 11.000 palabras.

Los expertos explican que las limitaciones en la producción de los LLM están vinculadas a la longitud del texto utilizado durante el ajuste fino supervisado (SFT). Para superar esta limitación, desarrollaron un sistema llamado AgentWrite que permite a los LLM generar una variedad de resultados coherentes de mayor extensión.

El equipo de investigación de la Universidad Tsinghua creó dos modelos abiertos, GLM-4 9B y LongWriter-glm4-9b, capaces de proporcionar respuestas «coherentes» de más de 10.000 palabras. Estos modelos han demostrado su capacidad para generar respuestas extensas y coherentes en comparación con las restricciones de longitud de texto impuestas.

La posibilidad de analizar y aplicar estos avances está disponible para cualquier interesado, lo cual refleja la filosofía abierta y colaborativa en el desarrollo de la inteligencia artificial. Esta contribución de la Universidad Tsinghua destaca la importancia de la investigación y el intercambio de conocimientos en este campo en constante evolución.

En un ejemplo práctico, los investigadores solicitaron a un chatbot basado en GLM-4 9B que generara una historia de 5000 palabras. La respuesta alcanzada fue de 1.896 palabras, mientras que LongWriter-glm4-9b logró generar 7.872 palabras en una respuesta. Esta diferencia destaca la capacidad mejorada del modelo para producir respuestas más extensas, incluso bajo restricciones preestablecidas.

La investigación de la Universidad Tsinghua en el campo de los chatbots con IA promete abrir nuevas posibilidades en la generación de respuestas extensas y coherentes. Estos avances representan un paso significativo en el desarrollo de tecnologías de lenguaje natural.

¿Qué opinas?

120 Votos
Upvote Downvote

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Autoridades reportan ataque armado a policías en Pakistán.

Unidad de Delitos Mayores de la RCMP lidera investigación de mujer desaparecida en N.B. por tres años