Conversation Memory : Définition et Exemples

La conversation memory désigne la capacité d'un modèle d'IA à retenir et exploiter les informations échangées au cours d'une conversation, permettant des interactions cohérentes et contextuellement pertinentes.

Définition complète

La conversation memory (ou mémoire conversationnelle) est un mécanisme fondamental des systèmes d'IA générative qui permet au modèle de conserver le contexte des échanges précédents au sein d'une même session. Sans cette capacité, chaque message serait traité de manière isolée, comme si l'utilisateur s'adressait à un interlocuteur amnésique. La mémoire conversationnelle est ce qui transforme une simple interface de questions-réponses en un véritable dialogue.

Concrètement, la conversation memory fonctionne en intégrant l'historique des messages (prompts de l'utilisateur et réponses du modèle) dans le contexte envoyé à chaque nouvelle requête. Ce contexte est limité par la fenêtre de contexte du modèle (context window), qui varie selon les architectures — de quelques milliers à plusieurs millions de tokens. Lorsque la conversation dépasse cette limite, les messages les plus anciens sont tronqués ou résumés, ce qui peut entraîner une perte d'informations.

Il existe plusieurs types de mémoire conversationnelle. La mémoire à court terme correspond à l'historique de la session en cours. La mémoire à long terme, plus récente, permet à certains systèmes de retenir des préférences et des informations d'une session à l'autre, grâce à des mécanismes de stockage persistant. Certaines plateformes proposent également une mémoire structurée, où l'utilisateur peut explicitement demander au modèle de retenir ou d'oublier certaines informations.

Maîtriser le fonctionnement de la conversation memory est essentiel en prompt engineering. Cela permet de structurer ses échanges pour maximiser la rétention des instructions importantes, d'éviter les pertes de contexte dans les conversations longues, et d'exploiter efficacement les capacités de personnalisation offertes par la mémoire persistante.

Étymologie

Le terme combine « conversation », du latin conversatio (échange, commerce), et « memory », du latin memoria (faculté de se souvenir). Dans le contexte de l'IA, il a été emprunté aux sciences cognitives et à la psychologie, où la mémoire de travail (working memory) désigne la capacité à maintenir temporairement des informations pour les utiliser dans un raisonnement en cours.

Exemples concrets

Maintenir le contexte dans un projet de rédaction long

Nous travaillons sur un article en 5 parties. Voici le plan que nous avons défini ensemble : [plan]. Nous en sommes à la partie 3. Garde en tête le ton et le style établis dans les parties précédentes.

Exploiter la mémoire persistante pour personnaliser les réponses

Retiens que je suis développeur Python senior et que je préfère les explications concises avec des exemples de code. Applique ces préférences à toutes nos futures conversations.

Gérer la perte de contexte dans une conversation longue

Avant de continuer, récapitulons les points clés de notre discussion : 1) l'objectif du projet, 2) les contraintes techniques identifiées, 3) l'architecture choisie. Confirme que tu as bien ces éléments en mémoire.

Usage pratique

Pour tirer le meilleur parti de la conversation memory, placez les instructions critiques en début de conversation et rappelez-les périodiquement dans les échanges longs. Utilisez des récapitulatifs explicites lorsque vous approchez des limites de la fenêtre de contexte, et structurez vos conversations en blocs thématiques pour faciliter la rétention des informations essentielles par le modèle.

Concepts liés

Context WindowSystem PromptFew-Shot PromptingRAG (Retrieval-Augmented Generation)

FAQ

Un modèle d'IA se souvient-il de toutes mes conversations précédentes ?

Par défaut, non. La plupart des modèles n'ont accès qu'à la conversation en cours. Cependant, certaines plateformes comme ChatGPT ou Claude proposent désormais des fonctionnalités de mémoire persistante qui permettent de retenir des informations d'une session à l'autre. Cette mémoire reste limitée et contrôlable par l'utilisateur.

Que se passe-t-il quand la conversation dépasse la fenêtre de contexte ?

Lorsque l'historique de la conversation dépasse la capacité de la fenêtre de contexte, les messages les plus anciens sont progressivement éliminés ou compressés. Le modèle perd alors l'accès à ces informations. C'est pourquoi il est recommandé de rappeler les éléments importants régulièrement et de structurer ses échanges pour que les instructions clés restent dans le contexte actif.

Comment puis-je améliorer la mémoire de l'IA pendant une longue conversation ?

Plusieurs techniques sont efficaces : demandez au modèle de produire des récapitulatifs réguliers, réitérez les contraintes et objectifs importants à intervalles, utilisez des marqueurs explicites (« rappel : ... ») pour les informations critiques, et découpez les tâches complexes en sous-conversations focalisées plutôt qu'un seul échange interminable.

Voir aussi

Context Window System Prompt Few-Shot Prompting Token RAG Chat History

Comment utiliser ce prompt

Copie le prompt avec le bouton ci-dessus.
Colle-le dans ChatGPT, Claude ou ton assistant IA préféré.
Remplace les variables entre crochets par tes informations, puis affine le résultat.

À propos de Prompt Guide

Prompt Guide est une bibliothèque gratuite de plus de 2500 prompts prêts à l'emploi pour ChatGPT, Claude et les autres IA, avec des guides pour apprendre à prompter et des outils pour créer et optimiser tes propres prompts.

Bibliothèque de prompts Apprendre à prompter Constructeur de prompt Optimiseur de prompt

Autres définitions

Copyright IA : Définition et Exemples

Le copyright IA désigne l'ensemble des questions juridiques liées à la protection par le droit d'auteur des contenus générés par l'intelligence artificielle, ai

CrewAI : Définition et Exemples

CrewAI est un framework open source en Python qui permet d'orchestrer plusieurs agents IA collaboratifs, chacun doté d'un rôle, d'objectifs et d'outils spécifiq

Cross Attention : Définition et Exemples

Mécanisme d'attention qui permet à un modèle de mettre en relation deux séquences différentes, comme une image et un texte, pour que chaque élément d'une séquen

Cursor : Définition et Présentation de l'Éditeur IA

Comprendre Cursor : éditeur de code IA-natif basé sur VS Code. Différences avec Claude Code, GitHub Copilot et Windsurf, cas d'usage concrets.

Custom GPT : Définition et Comment Créer le Tien

Comprendre les Custom GPTs d'OpenAI : assistants ChatGPT pré-configurés. Création pas-à-pas, différences avec Skills Claude et Gemini Gems.

Data Augmentation : Définition et Exemples

La data augmentation est une technique qui consiste à enrichir artificiellement un jeu de données d'entraînement en créant des variations des données existantes

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.