Retrieval : Définition et Exemples
Le retrieval (récupération) désigne le processus par lequel un système d'IA va chercher des informations pertinentes dans une base de données ou un corpus de documents pour enrichir sa réponse à une requête.
Définition complète
Le retrieval, ou récupération d'information, est un mécanisme fondamental en intelligence artificielle qui permet à un modèle de langage d'accéder à des connaissances externes au moment de générer une réponse. Plutôt que de se fier uniquement à ce qu'il a appris pendant son entraînement, le modèle interroge une source de données structurée pour trouver les passages les plus pertinents par rapport à la question posée.
Ce processus repose généralement sur des techniques de recherche sémantique : la requête de l'utilisateur est transformée en un vecteur numérique (embedding), puis comparée aux vecteurs des documents stockés dans une base vectorielle. Les documents les plus proches sémantiquement sont alors sélectionnés et injectés dans le contexte du modèle avant la génération de la réponse. C'est le principe au cœur de l'architecture RAG (Retrieval-Augmented Generation).
L'intérêt majeur du retrieval est de permettre aux modèles d'IA de fournir des réponses à jour, factuellement ancrées et spécifiques à un domaine, sans nécessiter un réentraînement coûteux. Une entreprise peut ainsi connecter un LLM à sa documentation interne, ses bases de connaissances ou ses archives, et obtenir des réponses contextualisées et fiables.
La qualité du retrieval conditionne directement la qualité de la réponse finale. Un mauvais retrieval — documents non pertinents, trop nombreux ou mal découpés — entraîne des hallucinations ou des réponses hors sujet. C'est pourquoi l'optimisation du pipeline de retrieval (chunking, ranking, filtrage) est devenue une discipline à part entière dans l'ingénierie des systèmes d'IA.
Étymologie
Du verbe anglais "to retrieve" (récupérer, retrouver), issu de l'ancien français "retrouver". En informatique, le terme est utilisé depuis les années 1950 dans le domaine de l'"Information Retrieval" (recherche d'information), discipline fondatrice des moteurs de recherche.
Exemples concrets
Un chatbot d'entreprise qui répond aux questions des employés en consultant la documentation interne
En te basant uniquement sur les documents fournis ci-dessous, réponds à la question suivante : quelle est la politique de télétravail de l'entreprise ?
Un assistant juridique qui recherche des articles de loi pertinents avant de formuler une analyse
Recherche dans le Code du travail les articles relatifs au licenciement économique, puis résume les obligations de l'employeur.
Un système de support client qui extrait les passages pertinents d'une FAQ avant de répondre
Usage pratique
En prompt engineering, le retrieval s'exploite principalement via des architectures RAG : on injecte dans le prompt les documents récupérés comme contexte, puis on demande au modèle de s'appuyer exclusivement sur ces sources. Pour optimiser les résultats, il faut soigner le découpage des documents (chunks de 200 à 500 tokens), formuler des requêtes de recherche précises, et instruire le modèle à citer ses sources ou à signaler quand l'information est absente du contexte fourni.
Concepts liés
FAQ
Quelle est la différence entre retrieval et RAG ?
Comment améliorer la qualité du retrieval ?
Le retrieval élimine-t-il les hallucinations du modèle ?
Voir aussi
Recevez de nouveaux prompts chaque semaine
Rejoignez notre newsletter.