La generación de tablas mejora consultas complejas de datos, superior a texto a SQL.

Un nuevo enfoque conocido como generación con tablas muestra promesas en la consulta de conjuntos de datos complejos, superando a la conversión de texto a SQL.

La inteligencia artificial ha revolucionado la forma en que las empresas trabajan e interactúan con los datos. Hace unos años, los equipos tenían que escribir consultas SQL y código para extraer información útil de grandes cantidades de datos. Hoy en día, todo lo que tienen que hacer es escribir una pregunta. Los sistemas basados en modelos de lenguaje subyacentes hacen el resto del trabajo, permitiendo a los usuarios simplemente hablar con sus datos y obtener la respuesta de inmediato.

El cambio hacia estos sistemas novedosos que presentan preguntas en lenguaje natural a las bases de datos ha sido prolífico, pero aún tiene algunos problemas. Básicamente, estos sistemas todavía no pueden manejar todo tipo de consultas. Esto es lo que los investigadores de UC Berkeley y Stanford están intentando resolver con un nuevo enfoque llamado generación con tablas, o TAG.

TAG es un paradigma unificado y de propósito general que representa una amplia gama de interacciones anteriormente inexploradas entre el modelo de lenguaje y la base de datos, creando una oportunidad emocionante para aprovechar el conocimiento del mundo y las capacidades de razonamiento de los LMs sobre los datos, según escribieron los investigadores de UC Berkeley y Stanford en un documento detallando TAG.

¿Cómo funciona la generación con tablas?

Actualmente, cuando un usuario hace preguntas en lenguaje natural sobre fuentes de datos personalizados, entran en juego dos enfoques principales: la conversión de texto a SQL o la generación aumentada de recuperación (RAG).

Si bien ambos métodos funcionan bastante bien, los usuarios comienzan a tener problemas cuando las preguntas se vuelven complejas y trascienden las capacidades de los sistemas. Por ejemplo, los métodos existentes de conversión de texto a SQL se centran únicamente en preguntas en lenguaje natural que pueden expresarse en álgebra relacional, lo que representa un pequeño subconjunto de preguntas que los usuarios pueden querer hacer. De manera similar, RAG, otro enfoque popular para trabajar con datos, considera solo las consultas que pueden responderse con búsquedas de puntos en uno o unos pocos registros de datos dentro de una base de datos.

Ambos enfoques a menudo tenían dificultades con las consultas en lenguaje natural que requieren razonamiento semántico o conocimiento del mundo más allá de lo que está directamente disponible en la fuente de datos.

Para abordar esta brecha, el grupo propuso TAG, un enfoque unificado que utiliza un modelo de tres pasos para la consulta conversacional sobre bases de datos.

En el primer paso, un LM deduce qué datos son relevantes para responder una pregunta y traduce la entrada en una consulta ejecutable (no solo SQL) para esa base de datos. Luego, el sistema aprovecha el motor de base de datos para ejecutar esa consulta sobre vastas cantidades de información almacenada y extraer la tabla más relevante. Finalmente, se activa el paso de generación de respuestas y se utiliza un LM sobre los datos calculados para generar una respuesta en lenguaje natural a la pregunta original del usuario.

Con este enfoque, las capacidades de razonamiento de los modelos de lenguaje se incorporan tanto en la síntesis de consultas como en la generación de respuestas, y la ejecución de consultas de los sistemas de bases de datos supera la ineficiencia de RAG en el manejo de tareas computacionales como el conteo, las matemáticas y el filtrado. Esto permite que el sistema responda a preguntas complejas que requieren tanto razonamiento semántico y conocimiento del mundo, así como conocimiento del dominio.

Por ejemplo, podría responder a una pregunta buscando el resumen de las críticas dadas a la película de romance más taquillera considerada un ‘clásico’.

Los resultados indican una mejora significativa en el rendimiento de TAG, superando a los baselines de texto a SQL y RAG. La implementación de TAG condujo a una ejecución de consultas tres veces más rápida que otros baselines.

En conclusión, el enfoque TAG ofrece a las empresas una forma de unificar las capacidades de la inteligencia artificial y las bases de datos para responder a preguntas complejas sobre fuentes de datos estructurados. Esto podría permitir que los equipos extraigan más valor de sus conjuntos de datos sin necesidad de escribir código complejo.

La generación de tablas mejora consultas complejas de datos, superior a texto a SQL.

¿Qué opinas?

Escrito por Redacción - El Semanal

Deja una respuestaCancelar la respuesta

El médico estético Antoni Calmon fallece a los 41 años

Disculpa de organizadores por error con delegación surcoreana en Juegos Olímpicos

Estrellas de Hollywood que debes conocer según expertos de cine.

La teoría cuántica redefine los principios de las relaciones internacionales

New Balance 991v1 White Croc llega a tiendas con los modelos M991CR1 y W991CR1

Xiaomi revoluciona IA con modelo que emula GPT-5.2 y Opus 4.6 a bajo costo.

Sospechoso graba ataque a casa de famoso rapero en Isla Vancouver.

Los embalses de la Comunidad de Madrid a punto de desbordarse en septiembre.

New Balance 991v1 White Croc llega a tiendas con los modelos M991CR1 y W991CR1

Xiaomi revoluciona IA con modelo que emula GPT-5.2 y Opus 4.6 a bajo costo.

Urban Outfitters intensifica inversión en calzado por demanda creciente

Bateman, Harrelson y Rockwell lideran thriller original de Netflix

Las mejores mascarillas LED transforman el skincare en casa.

¿Qué opinas?

Deja una respuestaCancelar la respuesta

Log In

With social network:

Or with username:

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections

Suscríbete a El Semanal