La revolución de la inteligencia artificial (IA) ha llevado a la creación de potentes modelos de lenguaje capaces de escribir, resumir y razonar sobre enormes cantidades de texto y otros tipos de datos. Sin embargo, cuando se trata de tareas predictivas de alto valor, como predecir la pérdida de clientes o detectar fraude a partir de datos estructurados y relacionales, las empresas siguen estando ancladas en el mundo del aprendizaje automático tradicional.
Un equipo de investigadores, liderado por el profesor de la Universidad de Stanford y cofundador de Kumo AI, Jure Leskovec, ha identificado esta carencia como una pieza crítica que falta en el panorama actual de la IA generativa. Para abordar este desafío, la empresa ha desarrollado una herramienta innovadora denominada «relational foundation model» (RFM), un nuevo tipo de IA pre-entrenada que aporta las capacidades de «zero-shot» de los grandes modelos de lenguaje (LLMs) a las bases de datos estructuradas.
El RFM se centra en realizar predicciones sobre eventos futuros desconocidos, lo que supone una capacidad fundamentalmente nueva que, según Leskovec, falta en la actual comprensión de lo que se considera IA generativa. Mientras que los LLMs y los sistemas de generación aumentada por recuperación (RAG) pueden responder a preguntas sobre conocimiento existente, son fundamentalmente retrospectivos, ya que recuperan y razonan sobre información que ya está ahí. Para tareas predictivas empresariales, las empresas siguen dependiendo del aprendizaje automático clásico.

Por ejemplo, para construir un modelo que prediga la pérdida de clientes, una empresa debe contratar a un equipo de científicos de datos que dediquen mucho tiempo a la «ingeniería de características», el proceso de crear manualmente señales predictivas a partir de los datos. Esto implica una compleja manipulación de datos para unir información de diferentes tablas, como el historial de compras de un cliente y los clics en el sitio web, para crear una única tabla de entrenamiento masiva.
Kumo AI ha encontrado una forma de generalizar los transformadores para bases de datos a través de su enfoque denominado «aprendizaje profundo relacional». Este método representa automáticamente cualquier base de datos relacional como un único gráfico interconectado. Por ejemplo, si la base de datos tiene una tabla de «usuarios» para registrar información del cliente y una tabla de «pedidos» para registrar compras de clientes, cada fila en la tabla de usuarios se convierte en un nodo de usuario, cada fila en una tabla de pedidos se convierte en un nodo de pedido, y así sucesivamente. Estos nodos se conectan automáticamente utilizando las relaciones existentes de la base de datos, como claves foráneas, creando un mapa rico del conjunto de datos completo sin esfuerzo manual.
Además, el RFM de Kumo aplica un mecanismo de atención similar al utilizado en los LLMs, pero adaptado a este gráfico, lo que le permite aprender patrones y relaciones complejas a través de múltiples tablas simultáneamente. El resultado es un modelo de base pre-entrenado que puede realizar tareas predictivas en una nueva base de datos al instante, lo que se conoce como «zero-shot». En una demostración, Leskovec mostró cómo un usuario puede escribir una consulta simple para predecir si un cliente específico realizaría un pedido en los próximos 30 días. En segundos, el sistema devolvió una puntuación de probabilidad y una explicación de los puntos de datos que llevaron a su conclusión, como la actividad reciente del usuario o la falta de ella.
Esta tecnología tiene importantes implicaciones para el desarrollo de agentes de IA. Para que un agente realice tareas significativas dentro de una empresa, debe hacer algo más que simplemente procesar lenguaje; debe tomar decisiones inteligentes basadas en los datos privados de la empresa. El RFM puede servir como motor predictivo para estos agentes. Por ejemplo, un agente de servicio al cliente podría consultar el RFM para determinar la probabilidad de pérdida de un cliente o su valor futuro potencial, y luego usar un LLM para adaptar su conversación y ofertas en consecuencia.
En resumen, el «relational foundation model» de Kumo AI supone un avance significativo en el campo de la IA predictiva, al hacer posible realizar predicciones precisas y oportunas a partir de datos estructurados sin necesidad de una costosa y laboriosa ingeniería de características. Con su capacidad para generalizar transformadores a bases de datos y aprender patrones complejos a través de múltiples tablas, el RFM promete poner potentes herramientas de aprendizaje automático al alcance de más empresas, reduciendo drásticamente el tiempo y el costo para pasar de los datos a la decisión.

GIPHY App Key not set. Please check settings