Los avances en los chatbots con inteligencia artificial (IA) han sido significativos en el último año. ChatGPT, Claudio y Géminis han logrado mantener el contexto en conversaciones más extensas y complejas, así como manejar entradas de texto cada vez más grandes. Sin embargo, una limitación importante que enfrentan es la capacidad de proporcionar respuestas que superen las 1000 palabras.
Esta restricción ha generado debates entre los usuarios, quienes se cuestionan por qué los chatbots tienen dificultades para manejar resultados extensos en una sola respuesta. La Universidad Tsinghua de Beijing ha abordado este problema y ha compartido sus hallazgos para su análisis público.
Uno de los aspectos más destacados de la investigación dirigida por Bai Yushi es la presentación de dos modelos de lenguaje a gran escala (LLM) que pueden generar respuestas de más de 10.000 palabras. Este logro es impresionante, considerando que novelas famosas como «La Metamorfosis» de Franz Kafka rondan las 11.000 palabras.

Los expertos explican que las limitaciones en la producción de los LLM están vinculadas a la longitud del texto utilizado durante el ajuste fino supervisado (SFT). Para superar esta limitación, desarrollaron un sistema llamado AgentWrite que permite a los LLM generar una variedad de resultados coherentes de mayor extensión.
El equipo de investigación de la Universidad Tsinghua creó dos modelos abiertos, GLM-4 9B y LongWriter-glm4-9b, capaces de proporcionar respuestas «coherentes» de más de 10.000 palabras. Estos modelos han demostrado su capacidad para generar respuestas extensas y coherentes en comparación con las restricciones de longitud de texto impuestas.
La posibilidad de analizar y aplicar estos avances está disponible para cualquier interesado, lo cual refleja la filosofía abierta y colaborativa en el desarrollo de la inteligencia artificial. Esta contribución de la Universidad Tsinghua destaca la importancia de la investigación y el intercambio de conocimientos en este campo en constante evolución.
En un ejemplo práctico, los investigadores solicitaron a un chatbot basado en GLM-4 9B que generara una historia de 5000 palabras. La respuesta alcanzada fue de 1.896 palabras, mientras que LongWriter-glm4-9b logró generar 7.872 palabras en una respuesta. Esta diferencia destaca la capacidad mejorada del modelo para producir respuestas más extensas, incluso bajo restricciones preestablecidas.
La investigación de la Universidad Tsinghua en el campo de los chatbots con IA promete abrir nuevas posibilidades en la generación de respuestas extensas y coherentes. Estos avances representan un paso significativo en el desarrollo de tecnologías de lenguaje natural.

GIPHY App Key not set. Please check settings