Nueva técnica mejora eficacia de sistemas RAG en búsqueda de documentos adecuados

Por Redacción - El Semanal octubre 10, 2024, 12:24 am 38k Vistas 2 Comentarios

Una nueva técnica mejora significativamente los sistemas RAG en la recuperación de documentos relevantes

Los sistemas de generación aumentada con recuperación (RAG) se han vuelto populares para darles un respaldo de conocimiento externo a los grandes modelos de lenguaje (LLMs). Estos sistemas suelen utilizar un modelo de incrustación para codificar documentos en un corpus de conocimiento y seleccionar aquellos más relevantes para la consulta del usuario.

Sin embargo, los métodos de recuperación estándar a menudo no consideran detalles específicos del contexto que pueden marcar una gran diferencia en conjuntos de datos específicos de aplicaciones. En un nuevo estudio, investigadores de la Universidad de Cornell presentan «incrustaciones de documentos contextuales,” una técnica que mejora el rendimiento de los modelos de incrustación al hacerlos conscientes del contexto en el que se recuperan los documentos.

Los investigadores proponen dos métodos complementarios para mejorar el rendimiento de los bi-encoders al agregar la noción de contexto a las incrustaciones de documentos. Estos métodos modifican el proceso de entrenamiento del modelo de incrustación y la arquitectura del bi-encoder para mejorar su sensibilidad a las diferencias sutiles que son importantes en contextos específicos.

La evaluación de su método en varios benchmarks demostró que supera consistentemente a los bi-encoders estándar de tamaños similares, especialmente en entornos fuera del dominio donde los conjuntos de datos de entrenamiento y prueba son significativamente diferentes. Además, los investigadores han lanzado una versión pequeña de su modelo de incrustación de documentos contextuales que puede usarse como un reemplazo para herramientas de código abierto populares, como HuggingFace y SentenceTransformers, para crear incrustaciones personalizadas para diferentes aplicaciones.

Esta técnica ofrece la posibilidad de mejorar significativamente el rendimiento de los sistemas RAG en diferentes dominios, siendo de utilidad especialmente en conjuntos de datos que difieren notablemente de los datos de entrenamiento. La capacidad de las incrustaciones contextuales para capturar tanto el contexto general del grupo de documentos como los detalles específicos que lo hacen único representa una mejora significativa en la recuperación de documentos relevantes.

¿Qué opinas?

120 Votos

Upvote Downvote

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuestaCancelar la respuesta

GIPHY App Key not set. Please check settings

2 Comments

Sort by

Juan_82 says:

octubre 10, 2024 at 12:35 am Copy Link of a Comment

Vaya artículo interesante, me parese que esta nueva técnica puede ser de mucha ayuda para encontrar documentos más rápidos. Parece que la tecnología avanza muy rápido, y es bueno ver cómo se mejoran los sistemas RAG. Gracias por compartir esta información!

0

Responder
Roberto_G says:

octubre 10, 2024 at 1:03 am Copy Link of a Comment

Considero que el artículo aborda un tema de relevancia en cuanto a la optimización de sistemas RAG para la búsqueda de documentos pertinentes. Sin embargo, se observan diversas deficiencias en la exposición de la información, lo cual dificulta la comprensión por parte de los lectores. Sería conveniente que se profundizara en la explicación de la técnica empleada, así como en los resultados obtenidos, a fin de brindar una visión más clara y completa del estudio realizado. Asimismo, se recomienda una revisión más detallada de la redacción para corregir errores ortográficos y gramaticales que afectan la calidad del texto.

0

Responder

Nueva técnica mejora eficacia de sistemas RAG en búsqueda de documentos adecuados

¿Qué opinas?

Escrito por Redacción - El Semanal

Deja una respuestaCancelar la respuesta

2 Comments

Former Infosys chief has a new startup that wants to challenge the IT services world

Los sistemas de IA refrigerados por líquido revelan la insuficiencia del almacenamiento tradicional.

Liverpool logra importante victoria sobre Leipzig con Díaz desde el banquillo.

Descubre los Mejores Formatos para Seguir tus Hábitos a Diario

El flamante rascacielos de Dubai prioriza la vida saludable desde su construcción.

Beyoncé respalda a Kamala Harris en un evento en Houston, Texas.

Cohere potencia capacidad visual en su motor de búsqueda RAG

Vectorize presenta nueva plataforma RAG para datos en tiempo real en empresas.

Secretos para mantener la calma y tomar decisiones acertadas: la lección de los estoicos y Steve Jobs

Harris ante la urgencia de distinguir su presidencia de la de Biden

Waller asegura que la Fed evita repetir la guerra inflacionaria, pero contempla alzas

Nasdaq cae por nuevos ataques EE.‑Irán y SK Hynix se desploma

TSMC registra ventas de junio 14% superiores a expectativas y consolida liderazgo

Cisco transforma su acción, lidera infraestructura IA y supera estancamiento de crecimiento

¿Qué opinas?

Deja una respuestaCancelar la respuesta

2 Comments

Log In

With social network:

Or with username:

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections

Suscríbete a El Semanal