Un reciente informe de la empresa proveedora de datos de inteligencia artificial Appen revela que las empresas están luchando por encontrar y gestionar datos de alta calidad necesarios para impulsar los sistemas de IA a medida que la inteligencia artificial se expande en las operaciones empresariales.
El informe «Estado de la IA 2024» de Appen, que encuestó a más de 500 líderes de TI en Estados Unidos, muestra que la adopción de IA generativa ha aumentado un 17% en el último año; sin embargo, las organizaciones ahora se enfrentan a importantes obstáculos en la preparación de datos y aseguramiento de calidad. El informe revela un aumento del 10% año tras año en los cuellos de botella relacionados con la obtención, limpieza y etiquetado de datos, subrayando las complejidades de construir y mantener modelos de IA efectivos.
Si Chen, Jefe de Estrategia en Appen, explicó en una entrevista con VentureBeat: «A medida que los modelos de IA abordan problemas más complejos y especializados, también cambian los requisitos de datos», dijo. «Las empresas están descubriendo que tener muchos datos ya no es suficiente. Para ajustar un modelo, los datos deben ser de extremadamente alta calidad, lo que significa que sean precisos, diversos, etiquetados correctamente y adaptados al caso de uso específico de la IA».
A pesar del crecimiento continuo del potencial de la IA, el informe identifica varias áreas clave donde las empresas están encontrando obstáculos. A continuación se presentan las cinco principales conclusiones del informe «Estado de la IA 2024» de Appen:
1. La adopción de IA generativa está en alza, pero también los desafíos de datos
La adopción de IA generativa ha crecido un impresionante 17% en 2024, impulsada por avances en modelos de lenguaje grandes que permiten a las empresas automatizar tareas en una amplia gama de casos de uso. Desde operaciones de TI hasta I+D, las empresas están aprovechando la IA generativa para optimizar procesos internos y aumentar la productividad. Sin embargo, el rápido aumento en el uso de IA generativa también ha introducido nuevos obstáculos, especialmente en la gestión de datos.
«Las salidas de IA generativa son más diversas, impredecibles y subjetivas, lo que dificulta definir y medir el éxito», dijo Chen a VentureBeat. «Para lograr una IA lista para empresas, los modelos deben ser personalizados con datos de alta calidad adaptados a casos de uso específicos».
La recolección de datos personalizados ha surgido como el método principal para obtener datos de entrenamiento para modelos de IA generativa, reflejando un cambio más amplio lejos de los datos genéricos raspados de la web a favor de conjuntos de datos personalizados y confiables.
El uso de IA generativa en procesos comerciales continúa expandiéndose, con aumentos notables en operaciones de TI, fabricación e investigación y desarrollo. Sin embargo, la adopción en áreas como marketing y comunicaciones ha disminuido ligeramente.
2. Las implementaciones de IA empresarial y el ROI están disminuyendo
A pesar de la emoción en torno a la IA, el informe encontró una tendencia preocupante: menos proyectos de IA están llegando a la implementación, y aquellos que lo hacen muestran menos ROI. Desde 2021, el porcentaje promedio de proyectos de IA que llegan a la implementación ha caído un 8,1%, mientras que el porcentaje promedio de proyectos de IA implementados que muestran un ROI significativo ha disminuido un 9,4%.
Esta disminución se debe en gran medida a la creciente complejidad de los modelos de IA. Casos de uso simples como el reconocimiento de imágenes y la automatización del habla ahora se consideran tecnologías maduras, pero las empresas se están moviendo hacia iniciativas de IA más ambiciosas, como la IA generativa, que requieren datos personalizados y de alta calidad y son mucho más difíciles de implementar con éxito.
Chen explicó: «La IA generativa tiene capacidades más avanzadas en comprensión, razonamiento y generación de contenido, pero estas tecnologías son inherentemente más desafiantes de implementar».
El porcentaje de proyectos de IA que llegan a la implementación ha disminuido constantemente desde 2021, con una caída brusca al 47,4% en 2024. De manera similar, el porcentaje promedio de proyectos implementados que muestran un ROI significativo ha caído al 47,3%, reflejando los crecientes desafíos que enfrentan las empresas para lograr implementaciones exitosas de IA.
3. La calidad de los datos es esencial, pero está disminuyendo
El informe destaca un problema crítico para el desarrollo de IA: la precisión de los datos ha disminuido casi un 9% desde 2021. A medida que los modelos de IA se vuelven más sofisticados, los datos que requieren también se han vuelto más complejos, a menudo requiriendo anotaciones especializadas y de alta calidad.
Un asombroso 86% de las empresas ahora vuelven a entrenar o actualizar sus modelos al menos una vez cada trimestre, subrayando la necesidad de datos frescos y relevantes. Sin embargo, a medida que aumenta la frecuencia de las actualizaciones, asegurar que estos datos sean precisos y diversos se vuelve más difícil. Las empresas recurren a proveedores de datos externos para ayudar a satisfacer estas demandas, con casi el 90% de las empresas confiando en fuentes externas para entrenar y evaluar sus modelos.
«Aunque no podemos predecir el futuro, nuestra investigación muestra que gestionar la calidad de los datos seguirá siendo un desafío importante para las empresas», dijo Chen. «Con modelos de IA generativa más complejos, la obtención, limpieza y etiquetado de datos se han convertido en cuellos de botella clave».
La gestión de datos surgió como el principal desafío para los proyectos de IA en 2024, con un 48% de los encuestados citándolo como un cuello de botella significativo. Otros obstáculos incluyen la falta de recursos técnicos, herramientas y datos, destacando la creciente complejidad de la implementación de IA.
4. Los cuellos de botella de datos empeoran
El informe de Appen revela un aumento del 10% año tras año en cuellos de botella relacionados con la obtención, limpieza y etiquetado de datos. Estos cuellos de botella están afectando directamente la capacidad de las empresas para implementar con éxito proyectos de IA. A medida que los casos de uso de IA se vuelven más especializados, el desafío de preparar los datos adecuados se vuelve más agudo.
«Los problemas de preparación de datos se han intensificado», dijo Chen. «La naturaleza especializada de estos modelos exige conjuntos de datos nuevos y personalizados».
Para abordar estos problemas, las empresas se están enfocando en estrategias a largo plazo que enfatizan la precisión, consistencia y diversidad de los datos. Muchas también están buscando asociaciones estratégicas con proveedores de datos para ayudar a navegar por las complejidades del ciclo de vida de los datos de IA.
La precisión de los datos en Estados Unidos ha disminuido constantemente, pasando del 63,5% en 2021 al 54,6% en 2024. La disminución resalta el creciente desafío de mantener datos de alta calidad a medida que los modelos de IA se vuelven más complejos.
5. La participación humana es más vital que nunca
Aunque la tecnología de IA continúa evolucionando, la participación humana sigue siendo indispensable. El informe encontró que el 80% de los encuestados enfatizó la importancia del aprendizaje automático con humanos en el circuito, un proceso en el que la experiencia humana se utiliza para guiar y mejorar los modelos de IA.
«La participación humana sigue siendo esencial para desarrollar sistemas de IA de alto rendimiento, éticos y contextualmente relevantes», dijo Chen.
Los expertos humanos son particularmente importantes para garantizar la mitigación de sesgos y el desarrollo ético de la IA. Al proporcionar conocimientos específicos del dominio e identificar posibles sesgos en las salidas de IA, ayudan a refinar los modelos y alinearlos con los comportamientos y valores del mundo real. Esto es especialmente crítico para la IA generativa, donde las salidas pueden ser impredecibles y requieren una supervisión cuidadosa para prevenir resultados dañinos o sesgados.
Echa un vistazo al informe completo «Estado de la IA 2024» de Appen aquí.
wau, mui interesante esto de la inteligensia artificial generativa, pero ke malo lo de la kalidad de los datos, deverían mejorar eso. graxias por el artículo, me dejó pensando.