P

Question Answering : Définition et Exemples

Le Question Answering (QA) est une branche du traitement automatique du langage naturel qui vise à générer des réponses précises et pertinentes à des questions posées en langage naturel.

Définition complète

Le Question Answering, ou réponse automatique aux questions, est un domaine de l'intelligence artificielle qui consiste à développer des systèmes capables de comprendre une question formulée en langage naturel et d'y apporter une réponse exacte. Contrairement à un moteur de recherche classique qui retourne une liste de documents, un système de QA extrait ou génère directement la réponse attendue.

On distingue plusieurs types de Question Answering. Le QA extractif identifie et extrait un passage précis d'un corpus de documents existant. Le QA génératif, lui, formule une réponse originale en synthétisant les informations disponibles — c'est le fonctionnement des grands modèles de langage comme Claude ou GPT. Il existe également le QA en domaine ouvert (open-domain), qui répond à des questions sur n'importe quel sujet, et le QA en domaine fermé (closed-domain), spécialisé sur un champ de connaissances précis.

Avec l'essor des LLM, le Question Answering est devenu l'un des cas d'usage les plus courants de l'IA générative. Les techniques de Retrieval-Augmented Generation (RAG) combinent recherche documentaire et génération pour fournir des réponses à la fois précises et fondées sur des sources vérifiables. En prompt engineering, maîtriser le QA permet de formuler des questions qui maximisent la qualité et la fiabilité des réponses obtenues.

Les applications sont nombreuses : assistants virtuels d'entreprise, chatbots de support client, systèmes de recherche médicale, outils éducatifs ou encore bases de connaissances interactives. La qualité d'un système de QA se mesure principalement par la pertinence, l'exactitude et la complétude de ses réponses.

Étymologie

Le terme "Question Answering" est issu de l'anglais et signifie littéralement "réponse aux questions". Ce champ de recherche existe depuis les années 1960 avec les premiers systèmes comme BASEBALL (1961) et LUNAR (1972), mais il a connu un essor majeur avec les compétitions TREC QA dans les années 2000, puis une révolution avec l'arrivée des modèles Transformer à partir de 2018.

Exemples concrets

Support client automatisé

En te basant uniquement sur la documentation suivante, réponds à la question du client de manière concise et précise. Si la réponse n'est pas dans la documentation, indique-le clairement. Documentation : {contexte}. Question : {question}

Analyse de documents juridiques

Tu es un assistant juridique. Lis attentivement le contrat suivant et réponds à cette question en citant les articles pertinents : quelles sont les conditions de résiliation anticipée ? Contrat : {document}

Révision et apprentissage

Je vais te poser des questions sur la Seconde Guerre mondiale. Pour chaque réponse, cite tes sources historiques et indique ton niveau de certitude. Question : Quelles étaient les causes économiques du conflit ?

Usage pratique

En prompt engineering, le Question Answering s'optimise en formulant des questions précises, en fournissant un contexte pertinent et en demandant explicitement au modèle de citer ses sources ou de signaler ses incertitudes. Utiliser des techniques comme le RAG permet d'ancrer les réponses dans des documents fiables et de réduire les hallucinations. Structurer ses prompts avec un rôle, un contexte et un format de réponse attendu améliore significativement la qualité du QA.

Concepts liés

Retrieval-Augmented Generation (RAG)Traitement du langage naturel (NLP)Extraction d'informationGrounding

FAQ

Quelle est la différence entre le Question Answering extractif et génératif ?
Le QA extractif localise et extrait un passage exact d'un document source pour répondre à la question. Le QA génératif, utilisé par les LLM, synthétise l'information et formule une réponse originale en langage naturel. Les approches modernes comme le RAG combinent les deux : recherche de passages pertinents puis génération d'une réponse synthétique.
Comment réduire les hallucinations dans un système de Question Answering ?
Plusieurs stratégies existent : fournir un contexte documentaire précis dans le prompt, demander au modèle de citer ses sources, utiliser une architecture RAG pour ancrer les réponses dans des documents vérifiés, et ajouter une instruction explicite comme « si tu ne connais pas la réponse, dis-le » pour éviter les réponses inventées.
Le Question Answering fonctionne-t-il dans toutes les langues ?
Les grands modèles de langage actuels comme Claude supportent le QA dans de nombreuses langues, dont le français. Cependant, les performances peuvent varier selon la langue en raison des déséquilibres dans les données d'entraînement. Pour des cas d'usage critiques dans une langue spécifique, il est recommandé de tester la qualité des réponses et d'utiliser des documents sources dans la langue cible.

Voir aussi

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.