A principios de esta semana, se revelaron detalles sobre la utilización de subtítulos de YouTube por parte de Apple y otras empresas tecnológicas para entrenar sus modelos de inteligencia artificial. Este conjunto de datos incluyó más de 170.000 vídeos de creadores populares como MKBHD y Mr. Beast. Apple, en particular, empleó esta información para el entrenamiento de su modelo OpenELM de código abierto, el cual fue lanzado en abril.
A pesar de la confirmación por parte de Apple, se destacó que OpenELM no incluye capacidades de inteligencia artificial o aprendizaje automático destinadas a apoyar Apple Intelligence. Según la empresa, el desarrollo de OpenELM se llevó a cabo con el propósito de contribuir a la comunidad de investigación y fomentar el avance en modelos de lenguaje grandes de código abierto.
El modelo OpenELM es específicamente diseñado para fines de investigación y no es utilizado para respaldar las funciones de Apple Intelligence. Su disponibilidad como código abierto permite que sea ampliamente utilizado, incluso a través del sitio web de investigación de aprendizaje automático de Apple.
A diferencia de las afirmaciones anteriores, se aclaró que el conjunto de datos de «Subtítulos de YouTube» no se emplea para respaldar las funciones de Apple Intelligence. Los modelos de inteligencia de Apple son entrenados con datos autorizados, incluyendo aquellos seleccionados para mejorar funciones específicas, así como datos de acceso público recolectados por sus rastreadores web.
Además, se informó que no existen planes por parte de Apple para desarrollar nuevas versiones del modelo OpenELM. Según un reporte de Wired, empresas como Apple, Anthropic y NVIDIA han utilizado el conjunto de datos de «subtítulos de YouTube» para entrenar sus propios modelos de inteligencia artificial. Este conjunto de datos forma parte de «The Pile», un extenso conjunto de datos de la organización sin fines de lucro EleutherAI.
GIPHY App Key not set. Please check settings