Le RAG (Retrieval Augmented Generation) étend les capacités des LLM en intégrant des informations spécifiques à votre entreprise : des bases de données ou documents qui viennent enrichir le contexte.
Profitez de la puissance de l'IA générative connectée à vos données internes
La puissance des LLMs et du RAG pour transformer la recherche d’information et la génération de connaissances
Performance du RAG avancé
Le RAG avancé surpasse de loin les autres technologies en termes de performance : le RAG simple obtient un score de précision.
CoT de 20%, quand le RAG avancé obtient un score de 60% lorsqu’il ne réalise pas de résumés d’images et 90% lorsque c’est le cas.
En résumé, les avantages stratégiques de notre technologie sont :
Données multimodales hétérogènes
Données de différentes sources
Vérification des sources en un clic
Après une phase préparatoire qui vient transformer votre base de connaissance de formats variés (pdf, word, pptx, etc), en une base de connaissance facilement et rapidement exploitable, le RAG fonctionne en 2 étapes.
Retrieval ou récupération : Cette phase consiste à explorer vos données afin de collecter les informations pertinentes pour répondre à la question. Pour cela, on effectue une comparaison sémantique entre la requête et un morceau de texte de notre index. On obtient les extraits de textes les plus proches sémantiquement
de la requête qui serviront de contexte au LLM.
Génération : La seconde étape permet de répondre à la question dans un
langage naturel.
Bien que le RAG puisse paraitre simple, son impact en entreprise est considérable.
Contrairement aux modèles linguistiques traditionnels qui se restreignent à des données parfois obsolètes de plusieurs mois ou années, le RAG permet au modèle de rester à jour.
« L'approche RAG multi-modale améliore la précision en intégrant des éléments visuels, offrant un contexte plus riche que les méthodes basées uniquement sur du texte. »
Les limites du RAG simple
Dans sa version simple, le RAG présente lui aussi des limites à l’utilisation en entreprise, notamment:
- Perte de contexte global :
Les paragraphes pris de manière isolée par la recherche sémantique peuvent ne pas contenir toutes les informations nécessaires pour comprendre le sujet en profondeur ou être mal interprétés sans les sections adjacentes.
- Perte d’informations structurales et multimodales :
Vos documents peuvent inclure du texte, mais aussi des graphiques, tableaux, et autres éléments visuels. L’encodage textuel standard ignore ces éléments, qui
peuvent être essentiels pour comprendre l’information complète.
- Problèmes de granularité :
Le choix de la granularité des segments de texte a un impact significatif sur les
performances du système RAG. Les paragraphes peuvent ne pas être de bonne granularité pour certains types d’informations ou de questions.
Le RAG avancé répond aux limites du RAG simple dans le cadre de l’utilisation en entreprise: il est à la fois capable de conserver 100% de l’information dans son outil de recherche lors de l’indexation, de la transformer de façon à ce qu’un LLM puisse mieux comprendre le contexte de l’information, mais aussi de répondre à un plus large panel de questions.
Conservation du contexte global :
Grâce à l’indexation multi-level et sur la base de la requête utilisateur, le chunk (morceau d’un document) le plus pertinent est extrait avec le document dont il fait partie. Cela permet une compréhension plus approfondie du contexte.
Prise en compte des documents et éléments visuels :
Grâce au RAG vision, l’information visuelle est conservée. C’est tout simplement l’intégration de capacités de traitement d’images dans le modèle RAG.
Assignation automatique de metadata :
Les metadata sont des informations structurées qui décrivent, identifient, et organisent les données. Elles enrichissent la compréhension et la recherche d’informations dans les différentes sources de données (textes, pdf, visuels…).