P

Context Management : Définition et Exemples

Le context management désigne l'ensemble des techniques permettant de contrôler, structurer et optimiser les informations contextuelles fournies à un modèle d'IA pour obtenir des réponses plus pertinentes et cohérentes.

Définition complète

Le context management (ou gestion du contexte) est une discipline fondamentale du prompt engineering qui consiste à maîtriser les informations de fond transmises à un grand modèle de langage (LLM). Chaque modèle dispose d'une fenêtre de contexte limitée — mesurée en tokens — dans laquelle doivent tenir à la fois les instructions, les données de référence et l'historique de conversation. Gérer efficacement ce contexte, c'est s'assurer que chaque token utilisé apporte une valeur maximale à la réponse.

En pratique, le context management recouvre plusieurs opérations : la sélection des informations pertinentes à inclure dans le prompt, leur hiérarchisation (du plus important au moins critique), la compression ou le résumé des échanges précédents, et l'injection dynamique de données externes via des techniques comme le RAG (Retrieval-Augmented Generation). L'objectif est de fournir au modèle exactement ce dont il a besoin pour répondre, ni plus ni moins.

Une mauvaise gestion du contexte entraîne des problèmes concrets : le modèle « oublie » des instructions données en début de conversation, produit des réponses incohérentes avec les échanges précédents, ou se retrouve saturé par des informations non pertinentes qui diluent la qualité de ses réponses. À l'inverse, un context management rigoureux permet de maintenir des conversations longues et cohérentes, d'exploiter pleinement les capacités du modèle et de réduire les coûts liés à l'utilisation de tokens inutiles.

Le context management est devenu d'autant plus stratégique avec l'émergence des agents IA autonomes et des systèmes multi-tours complexes. Dans ces architectures, le contexte doit être géré de manière programmatique : mémoires persistantes, systèmes de résumé automatique, fichiers d'instructions (comme les fichiers CLAUDE.md), et mécanismes de priorisation dynamique sont autant d'outils au service d'une gestion de contexte performante.

Étymologie

Le terme combine « context » (du latin contextus, « assemblage, enchaînement »), utilisé en linguistique pour désigner l'environnement textuel d'un énoncé, et « management » (de l'anglais, « gestion »). Dans le domaine de l'IA, il est apparu avec la popularisation des LLM pour désigner spécifiquement la gestion de la fenêtre de contexte (context window) de ces modèles.

Exemples concrets

Conversation longue avec un assistant IA où les premières instructions risquent d'être oubliées

Rappel de contexte : tu es un expert juridique français spécialisé en droit du travail. Nous discutons d'un cas de licenciement abusif. Voici le résumé de notre échange jusqu'ici : [résumé]. Maintenant, analyse ce nouveau document.

Système RAG qui injecte des documents pertinents avant de poser une question

Voici 3 extraits de notre documentation interne pertinents pour la question de l'utilisateur :
[Document 1 : ...]
[Document 2 : ...]
[Document 3 : ...]
En te basant uniquement sur ces documents, réponds à la question suivante : ...

Agent IA autonome qui doit gérer sa mémoire entre plusieurs sessions de travail

Tu disposes des fichiers de mémoire suivants pour ce projet. Consulte-les avant de commencer ta tâche. Si tu apprends des informations importantes pendant cette session, sauvegarde-les dans le fichier mémoire approprié.

Usage pratique

Pour appliquer le context management, commencez par placer vos instructions les plus importantes au début et à la fin de votre prompt (les modèles y prêtent davantage attention). Résumez régulièrement l'historique des échanges longs plutôt que de tout conserver verbatim. Enfin, structurez vos informations contextuelles avec des séparateurs clairs (balises XML, titres markdown) pour que le modèle puisse facilement identifier et hiérarchiser les différentes parties du contexte.

Concepts liés

Context WindowTokenRAG (Retrieval-Augmented Generation)System PromptFew-Shot PromptingMémoire conversationnellePrompt Chaining

FAQ

Quelle est la différence entre context management et prompt engineering ?
Le prompt engineering est la discipline globale qui consiste à formuler des instructions efficaces pour un LLM. Le context management en est une sous-discipline spécifique, focalisée sur la gestion des informations de fond et de l'historique fournis au modèle. On peut faire du prompt engineering sans se soucier du contexte (pour une requête simple), mais tout système complexe nécessite du context management.
Que se passe-t-il quand la fenêtre de contexte est dépassée ?
Lorsque le volume de tokens dépasse la capacité de la fenêtre de contexte du modèle, les informations les plus anciennes sont tronquées ou le modèle refuse la requête. C'est pourquoi il est essentiel de compresser, résumer ou sélectionner les informations contextuelles plutôt que de tout envoyer. Des techniques comme le résumé progressif ou le RAG permettent de contourner cette limite.
Comment gérer le contexte dans une application multi-utilisateurs ?
Dans une application multi-utilisateurs, chaque utilisateur doit disposer de son propre contexte isolé. Les bonnes pratiques incluent : stocker l'historique par session dans une base de données, injecter un résumé des échanges précédents au début de chaque nouvelle requête, et utiliser des systèmes de mémoire persistante (fichiers, bases vectorielles) pour conserver les informations importantes entre les sessions sans surcharger la fenêtre de contexte.

Voir aussi

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.