P

Retrieval : Définition et Exemples

Le retrieval (récupération) désigne le processus par lequel un système d'IA va chercher des informations pertinentes dans une base de données ou un corpus de documents pour enrichir sa réponse à une requête.

Définition complète

Le retrieval, ou récupération d'information, est un mécanisme fondamental en intelligence artificielle qui permet à un modèle de langage d'accéder à des connaissances externes au moment de générer une réponse. Plutôt que de se fier uniquement à ce qu'il a appris pendant son entraînement, le modèle interroge une source de données structurée pour trouver les passages les plus pertinents par rapport à la question posée.

Ce processus repose généralement sur des techniques de recherche sémantique : la requête de l'utilisateur est transformée en un vecteur numérique (embedding), puis comparée aux vecteurs des documents stockés dans une base vectorielle. Les documents les plus proches sémantiquement sont alors sélectionnés et injectés dans le contexte du modèle avant la génération de la réponse. C'est le principe au cœur de l'architecture RAG (Retrieval-Augmented Generation).

L'intérêt majeur du retrieval est de permettre aux modèles d'IA de fournir des réponses à jour, factuellement ancrées et spécifiques à un domaine, sans nécessiter un réentraînement coûteux. Une entreprise peut ainsi connecter un LLM à sa documentation interne, ses bases de connaissances ou ses archives, et obtenir des réponses contextualisées et fiables.

La qualité du retrieval conditionne directement la qualité de la réponse finale. Un mauvais retrieval — documents non pertinents, trop nombreux ou mal découpés — entraîne des hallucinations ou des réponses hors sujet. C'est pourquoi l'optimisation du pipeline de retrieval (chunking, ranking, filtrage) est devenue une discipline à part entière dans l'ingénierie des systèmes d'IA.

Étymologie

Du verbe anglais "to retrieve" (récupérer, retrouver), issu de l'ancien français "retrouver". En informatique, le terme est utilisé depuis les années 1950 dans le domaine de l'"Information Retrieval" (recherche d'information), discipline fondatrice des moteurs de recherche.

Exemples concrets

Un chatbot d'entreprise qui répond aux questions des employés en consultant la documentation interne

En te basant uniquement sur les documents fournis ci-dessous, réponds à la question suivante : quelle est la politique de télétravail de l'entreprise ?

Un assistant juridique qui recherche des articles de loi pertinents avant de formuler une analyse

Recherche dans le Code du travail les articles relatifs au licenciement économique, puis résume les obligations de l'employeur.

Un système de support client qui extrait les passages pertinents d'une FAQ avant de répondre

Usage pratique

En prompt engineering, le retrieval s'exploite principalement via des architectures RAG : on injecte dans le prompt les documents récupérés comme contexte, puis on demande au modèle de s'appuyer exclusivement sur ces sources. Pour optimiser les résultats, il faut soigner le découpage des documents (chunks de 200 à 500 tokens), formuler des requêtes de recherche précises, et instruire le modèle à citer ses sources ou à signaler quand l'information est absente du contexte fourni.

Concepts liés

RAG (Retrieval-Augmented Generation)EmbeddingBase de données vectorielleChunking

FAQ

Quelle est la différence entre retrieval et RAG ?
Le retrieval est l'étape de récupération des documents pertinents. Le RAG (Retrieval-Augmented Generation) est l'architecture complète qui combine cette étape de retrieval avec la génération de texte par un LLM. Le retrieval est donc une composante du RAG, pas un synonyme.
Comment améliorer la qualité du retrieval ?
Plusieurs leviers existent : optimiser la taille et le chevauchement des chunks, utiliser des modèles d'embedding adaptés à votre langue et domaine, appliquer un re-ranking après la recherche initiale, et enrichir les métadonnées des documents pour permettre un filtrage plus fin.
Le retrieval élimine-t-il les hallucinations du modèle ?
Il les réduit considérablement en ancrant les réponses dans des sources factuelles, mais ne les élimine pas totalement. Le modèle peut encore mal interpréter un passage ou extrapoler au-delà du contexte fourni. Il est recommandé d'ajouter des instructions explicites comme « réponds uniquement à partir des documents fournis » et de demander au modèle de signaler les incertitudes.

Voir aussi

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.