Question 1

Quelle est la différence entre RAG et fine-tuning ?

Accepted Answer

Le fine-tuning modifie les poids du modèle en l'entraînant sur des données spécifiques, ce qui est coûteux et nécessite un réentraînement à chaque mise à jour. Le RAG, lui, injecte les informations pertinentes au moment de la requête sans modifier le modèle. Le RAG est préférable quand les données changent fréquemment ou quand on a besoin de traçabilité des sources. Le fine-tuning est plus adapté pour modifier le style ou le comportement profond du modèle.

Question 2

Comment améliorer la qualité d'un système RAG ?

Accepted Answer

Plusieurs leviers existent : optimiser le découpage des documents (chunking) en utilisant des segments sémantiquement cohérents plutôt qu'un découpage fixe, choisir un modèle d'embeddings adapté à votre domaine et votre langue, ajouter une étape de re-ranking pour réordonner les résultats par pertinence, et enrichir les métadonnées des documents pour permettre un filtrage hybride (vectoriel + mots-clés). Tester et itérer sur ces paramètres avec des jeux de questions-réponses de référence est essentiel.

Question 3

Le RAG peut-il complètement éliminer les hallucinations ?

Accepted Answer

Non, le RAG réduit significativement les hallucinations mais ne les élimine pas totalement. Le modèle peut encore mal interpréter un passage récupéré, fusionner incorrectement des informations provenant de plusieurs sources, ou générer des extrapolations non fondées. Pour minimiser ce risque, il est recommandé de demander explicitement au modèle de citer ses sources et de ne répondre que si l'information est présente dans le contexte fourni.

RAG : Définition et Exemples

Définition complète

Étymologie

Exemples concrets

Usage pratique

Concepts liés

FAQ

Voir aussi

Recevez de nouveaux prompts chaque semaine