Inteligencia artificial de Google disminuye errores en consultas estadísticas.

Google ha lanzado DataGemma, un par de modelos de inteligencia artificial de código abierto, optimizados para manejar consultas estadísticas y mitigar la tendencia a proporcionar respuestas inexactas, conocida como alucinación, que algunos modelos de lenguaje grande (LLMs) presentan.

Estos nuevos modelos, disponibles en Hugging Face para uso académico e investigativo, se basan en la familia de modelos abiertos Gemma y utilizan datos del mundo real provenientes de la plataforma Data Commons de Google. Esta plataforma proporciona un grafo de conocimiento abierto con más de 240 mil millones de puntos de datos extraídos de organizaciones de confianza en sectores económicos, científicos, de salud y otros.

Para mejorar la precisión de las respuestas a consultas del usuario, los modelos utilizan dos enfoques distintos. Ambos métodos han demostrado ser eficaces en pruebas que abarcan un conjunto diverso de consultas.

Uno de los enfoques, denominado RIG (Retrieval Interleaved Generation), compara la generación original del modelo con estadísticas relevantes almacenadas en Data Commons para mejorar la exactitud factual de las respuestas. Por otro lado, el enfoque RAG (Retrieval Augmented Generation) permite a los modelos incorporar información relevante más allá de sus datos de entrenamiento, utilizando consultas naturales para extraer estadísticas pertinentes de Data Commons y generar respuestas precisas.

Las pruebas iniciales con DataGemma afinado mediante RIG mostraron mejoras significativas en la factibilidad de los modelos base, alcanzando alrededor del 58%. Por su parte, los modelos basados en RAG ofrecieron resultados ligeramente menos impresionantes pero aún superiores a los modelos base.

En general, los modelos DataGemma lograron responder entre el 24% y el 29% de las consultas con respuestas estadísticas de Data Commons, demostrando una precisión satisfactoria en la mayoría de los casos. Sin embargo, aún presentaron dificultades para inferir correctamente a partir de estos datos en un porcentaje reducido de consultas.

Google espera que el lanzamiento público de DataGemma con RIG y RAG impulse la investigación en ambos enfoques y permita construir modelos más sólidos y fundamentados en el futuro. Su compromiso es continuar refinando estas metodologías para integrar estas mejoras en los modelos Gemma y Gemini gradualmente a través de un enfoque de acceso limitado y escalado riguroso.

¿Qué opinas?

120 Votos
Upvote Downvote

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Manitobenses opinan sobre nuevas opciones de tarjeta de salud.

Corredor local sorprende con récord en maratón de la ciudad.