La empresa austriaca Mostly AI ha presentado una nueva funcionalidad que promete atacar un problema importante en el entrenamiento de inteligencia artificial para empresas. Conocida por proporcionar una plataforma para la generación de datos sintéticos, Mostly AI ha lanzado hoy la posibilidad de generar texto sintético. Esta innovación permitirá a las empresas aprovechar sus conjuntos de datos patentados sin preocuparse por los riesgos de privacidad.
La generación de texto sintético proporcionada por Mostly AI ofrece una versión sintética de la información de una organización, sin incluir información personal identificable (PII) o brechas de diversidad. Esto posibilita a los equipos entrenar y ajustar modelos de lenguaje grandes (LLM) de manera confiable para una innovación más rápida y una toma de decisiones mejorada.
Esta capacidad llega en un momento en el que el entrenamiento de inteligencia artificial se encuentra en un punto de estancamiento y las empresas buscan fuentes de datos que ofrezcan un valor y potencial mayores que los datos públicos residuales.
La generación de datos sintéticos, o datos generados artificialmente, se considera a menudo como la alternativa cuando los datos reales son demasiado costosos, no disponibles, desequilibrados o inutilizables. Aunque las empresas han estado produciendo y trabajando con información sintética (principalmente imágenes) durante bastante tiempo, se espera que el auge de la inteligencia artificial generativa propulse su aplicación a un nivel completamente nuevo, abarcando una gama más amplia de tipos de datos.
Una de las ventajas de la generación de texto sintético es su capacidad para capacitar a un generador de IA interno que pueda producir datos sintéticos sobre la marcha, capturando matices e información detallada. Mostly AI comenzó permitiendo la generación de conjuntos de datos tabulares estructurados para luego expandirse a datos de texto, como correos electrónicos, conversaciones de chatbot y transcripciones de soporte.
Al utilizar la nueva funcionalidad de texto sintético en la plataforma de Mostly AI, los usuarios pueden entrenar un generador de IA utilizando cualquier texto propio que tengan y luego desplegarlo para producir una versión sintética depurada de los datos originales, libre de PII o brechas de diversidad. Además, los usuarios tienen a su disposición una variedad de opciones de modelos de lenguaje para entrenar al generador.
La capacidad de generar texto sintético a partir de los generadores de la plataforma de Mostly AI permitirá a las empresas alimentar una variedad de casos de uso de análisis y gen IA. Aunque todavía no hay aplicaciones en vivo, la empresa está considerando la generación de pares de respuesta de manera automatizada como una aplicación inicial.
En resumen, la nueva funcionalidad de texto sintético de Mostly AI ofrece a las empresas una forma de desbloquear valor de sus datos de texto patentados sin preocupaciones de privacidad, lo que la convierte en una oferta atractiva para aquellas empresas que buscan fortalecer sus esfuerzos de capacitación en inteligencia artificial.
GIPHY App Key not set. Please check settings