Vectorize presenta su nueva plataforma RAG para datos empresariales en tiempo real
En el mundo actual, las bases de datos vectoriales son cada vez más comunes como parte fundamental de la implementación de la IA empresarial para la Generación Aumentada de Recuperación (RAG, por sus siglas en inglés), pero eso no es todo lo que se necesita.
Chris Latimer, CEO y cofundador de la startup Vectorize, pasó varios años trabajando en DataStax, donde ayudó a liderar los esfuerzos en la nube de ese proveedor de bases de datos. Un problema recurrente que observó una y otra vez fue que la base de datos vectorial no era realmente la parte difícil para habilitar el RAG empresarial. La parte difícil del problema era tomar todos los datos no estructurados y llevarlos a la base de datos vectorial de una manera optimizada que funcionara bien para la IA generativa.
Es por eso que Latimer fundó Vectorize hace apenas diez meses, con el objetivo de ayudar a resolver ese desafío.
Hoy, la empresa anuncia que ha recaudado 3.6 millones de dólares en una ronda de financiación semilla, liderada por True Ventures. Junto con la financiación, la compañía anunció la disponibilidad general de su plataforma RAG empresarial. La plataforma de Vectorize puede habilitar un enfoque RAG agente para capacidades de datos casi en tiempo real. Vectorize se enfoca en el lado de la ingeniería de datos de la IA. La plataforma ayuda a las empresas a preparar y mantener sus datos para su uso en bases de datos vectoriales y grandes modelos de lenguaje. La plataforma de Vectorize también permite a las empresas construir rápidamente una tubería de datos RAG a través de una interfaz intuitiva. Otra capacidad central es una función de evaluación RAG que permite a las empresas probar diferentes enfoques.
«Seguimos viendo que las personas llegan al final del ciclo de desarrollo de sus proyectos de IA generativa y descubren que no funcionan realmente bien», dijo Chris Latimer, cofundador y CEO de Vectorize, en una entrevista exclusiva con VentureBeat. «El contexto que obtenían para su base de datos vectorial no era el más útil para el gran modelo de lenguaje, seguía alucinando o malinterpretando los datos».
Como encaja Vectorize en la pila empresarial RAG
Vectorize no es una base de datos vectorial en sí misma. Más bien, es una plataforma que conecta fuentes de datos no estructurados a bases de datos vectoriales existentes como Pinecone, DataStax, Couchbase y Elastic.
Latimer explicó que Vectorize ingiere y optimiza datos de diversas fuentes para bases de datos vectoriales. La plataforma proporcionará una tubería de datos lista para producción que maneja la ingestión, sincronización, manejo de errores y otras mejores prácticas de ingeniería de datos.
Vectorize en sí misma tampoco es una tecnología de inserción vectorial. El proceso de convertir datos, ya sea texto, imágenes o audio, en vectores, es de lo que se trata la inserción vectorial. Vectorize ayuda a los usuarios a evaluar diferentes modelos de inserción y métodos de fragmentación de datos para determinar la mejor configuración para el caso de uso y los datos específicos de la empresa.
Latimer explicó que Vectorize permite a los usuarios elegir entre cualquier cantidad de modelos de inserción diferentes. Los diferentes modelos podrían incluir, por ejemplo, ada de OpenAI, o incluso las inserciones de Voyage AI, que ahora están siendo adoptadas por Snowflake.
«Tenemos en cuenta formas innovadoras de vectorizar los datos para que obtenga los mejores resultados», dijo Latimer. «Pero en última instancia, donde vemos el valor es en brindar a las empresas y a los desarrolladores una solución lista para producción en la que no tengan que preocuparse por el lado de la ingeniería de datos».
Usando la IA agente para impulsar el RAG empresarial
Una de las principales innovaciones de Vectorize es su enfoque «agente RAG». Es un enfoque que combina técnicas tradicionales de RAG con capacidades de agente de IA, lo que permite una resolución de problemas más autónoma en las aplicaciones.
El agente RAG no es un concepto hipotético. Ya está siendo utilizado por uno de los primeros usuarios de Vectorize, la startup de silicio de inferencia de IA Groq, que recientemente recaudó 640 millones de dólares. Grok está utilizando las capacidades agente RAG de Vectorize para impulsar un agente de soporte de IA. El agente puede resolver autónomamente problemas de los clientes utilizando los datos y el contexto proporcionados por las tuberías de datos de Vectorize.
«Si un cliente tiene una pregunta que ya ha sido formulada y respondida, queremos que ese agente pueda resolver el problema del cliente sin la intervención de un humano», dijo Latimer. «Pero si hay algo que el agente no puede resolver, queremos tener un humano en el proceso para que pueda escalarse, por lo que esta idea de poder hacer que un agente razona a través de la resolución de un problema es toda la idea detrás de una arquitectura de agente de IA».
Por qué las tuberías de datos en tiempo real son esenciales para el RAG empresarial
Una razón principal por la que una empresa utilizará RAG es para conectarse a sus propias fuentes de datos. Sin embargo, es igualmente importante asegurarse de que los datos estén actualizados.
«Los datos obsoletos conducirán a decisiones obsoletas», dijo Latimer. Vectorize proporciona capacidades de actualización de datos en tiempo real y casi en tiempo real, con la capacidad para que los clientes configuren su tolerancia para la obsolescencia de los datos.
«De hecho, hemos permitido a las personas configurar la plataforma en función de su tolerancia a los datos obsoletos y su necesidad de datos en tiempo real», dijo. «Así que si todo lo que necesita es programar su tubería para que se ejecute una vez por semana, le permitiremos hacerlo, y luego, si necesita ejecutar en tiempo real, también le permitiremos hacerlo, y tendrá actualizaciones en tiempo real tan pronto como estén disponibles».
🚀 ¡IMPRESIONANTE avance de Vectorize con la nueva plataforma RAG para DATOS en tiempo real en empresas! 👏 ¡La tecnología no deja de sorprendernos! 🤯