Context Management : Définition et Exemples

Le context management désigne l'ensemble des techniques permettant de contrôler, structurer et optimiser les informations contextuelles fournies à un modèle d'IA pour obtenir des réponses plus pertinentes et cohérentes.

Définition complète

Le context management (ou gestion du contexte) est une discipline fondamentale du prompt engineering qui consiste à maîtriser les informations de fond transmises à un grand modèle de langage (LLM). Chaque modèle dispose d'une fenêtre de contexte limitée — mesurée en tokens — dans laquelle doivent tenir à la fois les instructions, les données de référence et l'historique de conversation. Gérer efficacement ce contexte, c'est s'assurer que chaque token utilisé apporte une valeur maximale à la réponse.

En pratique, le context management recouvre plusieurs opérations : la sélection des informations pertinentes à inclure dans le prompt, leur hiérarchisation (du plus important au moins critique), la compression ou le résumé des échanges précédents, et l'injection dynamique de données externes via des techniques comme le RAG (Retrieval-Augmented Generation). L'objectif est de fournir au modèle exactement ce dont il a besoin pour répondre, ni plus ni moins.

Une mauvaise gestion du contexte entraîne des problèmes concrets : le modèle « oublie » des instructions données en début de conversation, produit des réponses incohérentes avec les échanges précédents, ou se retrouve saturé par des informations non pertinentes qui diluent la qualité de ses réponses. À l'inverse, un context management rigoureux permet de maintenir des conversations longues et cohérentes, d'exploiter pleinement les capacités du modèle et de réduire les coûts liés à l'utilisation de tokens inutiles.

Le context management est devenu d'autant plus stratégique avec l'émergence des agents IA autonomes et des systèmes multi-tours complexes. Dans ces architectures, le contexte doit être géré de manière programmatique : mémoires persistantes, systèmes de résumé automatique, fichiers d'instructions (comme les fichiers CLAUDE.md), et mécanismes de priorisation dynamique sont autant d'outils au service d'une gestion de contexte performante.

Étymologie

Le terme combine « context » (du latin contextus, « assemblage, enchaînement »), utilisé en linguistique pour désigner l'environnement textuel d'un énoncé, et « management » (de l'anglais, « gestion »). Dans le domaine de l'IA, il est apparu avec la popularisation des LLM pour désigner spécifiquement la gestion de la fenêtre de contexte (context window) de ces modèles.

Exemples concrets

Conversation longue avec un assistant IA où les premières instructions risquent d'être oubliées

Rappel de contexte : tu es un expert juridique français spécialisé en droit du travail. Nous discutons d'un cas de licenciement abusif. Voici le résumé de notre échange jusqu'ici : [résumé]. Maintenant, analyse ce nouveau document.

Système RAG qui injecte des documents pertinents avant de poser une question

Voici 3 extraits de notre documentation interne pertinents pour la question de l'utilisateur :
[Document 1 : ...]
[Document 2 : ...]
[Document 3 : ...]
En te basant uniquement sur ces documents, réponds à la question suivante : ...

Agent IA autonome qui doit gérer sa mémoire entre plusieurs sessions de travail

Tu disposes des fichiers de mémoire suivants pour ce projet. Consulte-les avant de commencer ta tâche. Si tu apprends des informations importantes pendant cette session, sauvegarde-les dans le fichier mémoire approprié.

Usage pratique

Pour appliquer le context management, commencez par placer vos instructions les plus importantes au début et à la fin de votre prompt (les modèles y prêtent davantage attention). Résumez régulièrement l'historique des échanges longs plutôt que de tout conserver verbatim. Enfin, structurez vos informations contextuelles avec des séparateurs clairs (balises XML, titres markdown) pour que le modèle puisse facilement identifier et hiérarchiser les différentes parties du contexte.

Concepts liés

Context WindowTokenRAG (Retrieval-Augmented Generation)System PromptFew-Shot PromptingMémoire conversationnellePrompt Chaining

FAQ

Quelle est la différence entre context management et prompt engineering ?

Le prompt engineering est la discipline globale qui consiste à formuler des instructions efficaces pour un LLM. Le context management en est une sous-discipline spécifique, focalisée sur la gestion des informations de fond et de l'historique fournis au modèle. On peut faire du prompt engineering sans se soucier du contexte (pour une requête simple), mais tout système complexe nécessite du context management.

Que se passe-t-il quand la fenêtre de contexte est dépassée ?

Lorsque le volume de tokens dépasse la capacité de la fenêtre de contexte du modèle, les informations les plus anciennes sont tronquées ou le modèle refuse la requête. C'est pourquoi il est essentiel de compresser, résumer ou sélectionner les informations contextuelles plutôt que de tout envoyer. Des techniques comme le résumé progressif ou le RAG permettent de contourner cette limite.

Comment gérer le contexte dans une application multi-utilisateurs ?

Dans une application multi-utilisateurs, chaque utilisateur doit disposer de son propre contexte isolé. Les bonnes pratiques incluent : stocker l'historique par session dans une base de données, injecter un résumé des échanges précédents au début de chaque nouvelle requête, et utiliser des systèmes de mémoire persistante (fichiers, bases vectorielles) pour conserver les informations importantes entre les sessions sans surcharger la fenêtre de contexte.

Voir aussi

Context Window Token RAG System Prompt Prompt Chaining Few-Shot Prompting Mémoire conversationnelle

Comment utiliser ce prompt

Copie le prompt avec le bouton ci-dessus.
Colle-le dans ChatGPT, Claude ou ton assistant IA préféré.
Remplace les variables entre crochets par tes informations, puis affine le résultat.

À propos de Prompt Guide

Prompt Guide est une bibliothèque gratuite de plus de 2500 prompts prêts à l'emploi pour ChatGPT, Claude et les autres IA, avec des guides pour apprendre à prompter et des outils pour créer et optimiser tes propres prompts.

Bibliothèque de prompts Apprendre à prompter Constructeur de prompt Optimiseur de prompt

Autres définitions

Context Window : Définition et Exemples

La context window (ou fenêtre de contexte) désigne la quantité maximale de texte qu'un modèle de langage peut traiter en une seule fois, englobant à la fois l'e

Contextual Prompting : Définition et Exemples

Technique de prompt engineering qui consiste à fournir au modèle d'IA un contexte riche et pertinent pour orienter sa réponse de manière précise et adaptée à la

Continual Learning : Définition et Exemples

Le Continual Learning (apprentissage continu) désigne la capacité d'un modèle d'IA à apprendre de nouvelles tâches ou données de manière séquentielle, sans oubl

Contrastive Prompting : Définition et Exemples

Technique de prompt engineering qui consiste à fournir au modèle des exemples de ce qu'il doit faire ET de ce qu'il ne doit pas faire, afin d'affiner sa compréh

Conversation Memory : Définition et Exemples

La conversation memory désigne la capacité d'un modèle d'IA à retenir et exploiter les informations échangées au cours d'une conversation, permettant des intera

Copyright IA : Définition et Exemples

Le copyright IA désigne l'ensemble des questions juridiques liées à la protection par le droit d'auteur des contenus générés par l'intelligence artificielle, ai

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.