Un nuevo enfoque conocido como generación con tablas muestra promesas en la consulta de conjuntos de datos complejos, superando a la conversión de texto a SQL.
La inteligencia artificial ha revolucionado la forma en que las empresas trabajan e interactúan con los datos. Hace unos años, los equipos tenían que escribir consultas SQL y código para extraer información útil de grandes cantidades de datos. Hoy en día, todo lo que tienen que hacer es escribir una pregunta. Los sistemas basados en modelos de lenguaje subyacentes hacen el resto del trabajo, permitiendo a los usuarios simplemente hablar con sus datos y obtener la respuesta de inmediato.
El cambio hacia estos sistemas novedosos que presentan preguntas en lenguaje natural a las bases de datos ha sido prolífico, pero aún tiene algunos problemas. Básicamente, estos sistemas todavía no pueden manejar todo tipo de consultas. Esto es lo que los investigadores de UC Berkeley y Stanford están intentando resolver con un nuevo enfoque llamado generación con tablas, o TAG.
TAG es un paradigma unificado y de propósito general que representa una amplia gama de interacciones anteriormente inexploradas entre el modelo de lenguaje y la base de datos, creando una oportunidad emocionante para aprovechar el conocimiento del mundo y las capacidades de razonamiento de los LMs sobre los datos, según escribieron los investigadores de UC Berkeley y Stanford en un documento detallando TAG.
¿Cómo funciona la generación con tablas?
Actualmente, cuando un usuario hace preguntas en lenguaje natural sobre fuentes de datos personalizados, entran en juego dos enfoques principales: la conversión de texto a SQL o la generación aumentada de recuperación (RAG).
Si bien ambos métodos funcionan bastante bien, los usuarios comienzan a tener problemas cuando las preguntas se vuelven complejas y trascienden las capacidades de los sistemas. Por ejemplo, los métodos existentes de conversión de texto a SQL se centran únicamente en preguntas en lenguaje natural que pueden expresarse en álgebra relacional, lo que representa un pequeño subconjunto de preguntas que los usuarios pueden querer hacer. De manera similar, RAG, otro enfoque popular para trabajar con datos, considera solo las consultas que pueden responderse con búsquedas de puntos en uno o unos pocos registros de datos dentro de una base de datos.
Ambos enfoques a menudo tenían dificultades con las consultas en lenguaje natural que requieren razonamiento semántico o conocimiento del mundo más allá de lo que está directamente disponible en la fuente de datos.
Para abordar esta brecha, el grupo propuso TAG, un enfoque unificado que utiliza un modelo de tres pasos para la consulta conversacional sobre bases de datos.
En el primer paso, un LM deduce qué datos son relevantes para responder una pregunta y traduce la entrada en una consulta ejecutable (no solo SQL) para esa base de datos. Luego, el sistema aprovecha el motor de base de datos para ejecutar esa consulta sobre vastas cantidades de información almacenada y extraer la tabla más relevante. Finalmente, se activa el paso de generación de respuestas y se utiliza un LM sobre los datos calculados para generar una respuesta en lenguaje natural a la pregunta original del usuario.
Con este enfoque, las capacidades de razonamiento de los modelos de lenguaje se incorporan tanto en la síntesis de consultas como en la generación de respuestas, y la ejecución de consultas de los sistemas de bases de datos supera la ineficiencia de RAG en el manejo de tareas computacionales como el conteo, las matemáticas y el filtrado. Esto permite que el sistema responda a preguntas complejas que requieren tanto razonamiento semántico y conocimiento del mundo, así como conocimiento del dominio.
Por ejemplo, podría responder a una pregunta buscando el resumen de las críticas dadas a la película de romance más taquillera considerada un ‘clásico’.
Los resultados indican una mejora significativa en el rendimiento de TAG, superando a los baselines de texto a SQL y RAG. La implementación de TAG condujo a una ejecución de consultas tres veces más rápida que otros baselines.
En conclusión, el enfoque TAG ofrece a las empresas una forma de unificar las capacidades de la inteligencia artificial y las bases de datos para responder a preguntas complejas sobre fuentes de datos estructurados. Esto podría permitir que los equipos extraigan más valor de sus conjuntos de datos sin necesidad de escribir código complejo.
GIPHY App Key not set. Please check settings