Memory System : Définition et Exemples

Mécanisme permettant à un modèle d'IA de conserver, organiser et réutiliser des informations au-delà d'une seule conversation, simulant une forme de mémoire persistante.

Définition complète

Un Memory System (système de mémoire) désigne l'ensemble des mécanismes techniques et architecturaux qui permettent à un modèle de langage de retenir des informations entre les interactions. Par défaut, les LLM sont « sans état » : chaque nouvelle conversation repart de zéro. Un système de mémoire vient combler cette limitation en stockant des données contextuelles — préférences utilisateur, historique de décisions, faits appris — dans des fichiers, bases de données ou embeddings vectoriels.

On distingue plusieurs niveaux de mémoire. La mémoire de contexte (in-context memory) correspond aux informations présentes dans la fenêtre de tokens active : instructions système, messages précédents, documents injectés. La mémoire persistante (persistent memory) va au-delà de la session en cours : elle repose sur des fichiers externes, des bases vectorielles ou des systèmes de retrieval (RAG) qui alimentent le modèle en informations pertinentes à chaque nouvelle requête.

Les systèmes de mémoire modernes s'organisent souvent par types : mémoire utilisateur (qui est l'interlocuteur, ses préférences), mémoire de projet (contexte métier, décisions en cours), mémoire de feedback (corrections passées à ne pas répéter) et mémoire de référence (où trouver l'information). Cette catégorisation permet au modèle de mobiliser le bon type d'information au bon moment.

L'enjeu central d'un Memory System est le compromis entre exhaustivité et pertinence. Stocker trop d'informations sature le contexte et dégrade les performances ; en stocker trop peu fait perdre la continuité. Les meilleures implémentations utilisent des index, des résumés et des mécanismes de recherche sémantique pour ne charger que les souvenirs réellement utiles à la tâche en cours.

Étymologie

Le terme emprunte au domaine des sciences cognitives, où le « memory system » désigne les structures cérébrales responsables de l'encodage, du stockage et de la récupération des souvenirs. En IA, il a été adopté pour décrire les architectures qui reproduisent ces fonctions de manière programmatique, notamment avec l'essor des agents autonomes en 2023-2024.

Exemples concrets

Assistant personnel avec mémoire persistante

Rappelle-toi que je préfère les réponses concises et que je travaille sur un projet Next.js. Utilise cette information dans nos futures conversations.

Agent de développement avec mémoire de feedback

La dernière fois tu as utilisé des mocks dans les tests alors que je t'avais dit de toujours utiliser la vraie base de données. Retiens cette consigne pour la suite.

Système RAG avec mémoire de référence

Quand je te pose des questions sur l'architecture du projet, consulte d'abord le fichier ARCHITECTURE.md et les notes de réunion stockées dans /docs/decisions/.

Usage pratique

En prompt engineering, exploitez les systèmes de mémoire en structurant explicitement les informations à retenir : séparez les faits durables (préférences, règles métier) des informations éphémères (tâche en cours). Utilisez des instructions système pour indiquer au modèle quand sauvegarder et quand consulter sa mémoire. Dans les architectures agentiques, combinez mémoire à court terme (contexte de conversation) et mémoire à long terme (base vectorielle ou fichiers indexés) pour maintenir la cohérence sur des projets complexes.

Concepts liés

RAG (Retrieval-Augmented Generation)Context WindowEmbeddings vectorielsAgent autonome

FAQ

Quelle est la différence entre la fenêtre de contexte et un système de mémoire ?

La fenêtre de contexte est la mémoire de travail immédiate du modèle : elle contient tout ce qui est envoyé dans une requête (prompt système, historique récent, documents). Un système de mémoire est une couche supplémentaire qui persiste au-delà de cette fenêtre, en stockant des informations dans des fichiers ou bases de données externes et en les réinjectant de manière sélective dans le contexte quand elles sont pertinentes.

Comment implémenter un système de mémoire simple pour un chatbot ?

L'approche la plus accessible consiste à sauvegarder les informations clés dans un fichier structuré (JSON ou Markdown) après chaque conversation, puis à injecter les entrées pertinentes dans le prompt système au début de la session suivante. Pour des besoins plus avancés, une base vectorielle (comme Pinecone ou ChromaDB) permet de faire de la recherche sémantique et de ne charger que les souvenirs les plus proches de la requête courante.

Un système de mémoire rend-il le modèle plus intelligent ?

Pas directement : le modèle conserve les mêmes capacités de raisonnement. En revanche, un bon système de mémoire lui donne accès à un contexte plus riche et plus pertinent, ce qui améliore significativement la qualité et la cohérence de ses réponses. C'est comparable à la différence entre travailler de mémoire et travailler avec ses notes sous les yeux.

Voir aussi

Context Window RAG Embeddings Agent IA Prompt Système Fine-Tuning

Comment utiliser ce prompt

Copie le prompt avec le bouton ci-dessus.
Colle-le dans ChatGPT, Claude ou ton assistant IA préféré.
Remplace les variables entre crochets par tes informations, puis affine le résultat.

À propos de Prompt Guide

Prompt Guide est une bibliothèque gratuite de plus de 2500 prompts prêts à l'emploi pour ChatGPT, Claude et les autres IA, avec des guides pour apprendre à prompter et des outils pour créer et optimiser tes propres prompts.

Bibliothèque de prompts Apprendre à prompter Constructeur de prompt Optimiseur de prompt

Autres définitions

Meta Ai : Définition et Exemples

Meta AI désigne la division d'intelligence artificielle de Meta (anciennement Facebook), responsable du développement de modèles de langage comme LLaMA et de l'

Meta Learning : Définition et Exemples

Le meta learning, ou « apprentissage de l'apprentissage », désigne la capacité d'un modèle d'IA ou d'un utilisateur à améliorer ses stratégies d'apprentissage e

Misinformation IA : Définition et Exemples

La misinformation IA désigne la diffusion d'informations fausses ou trompeuses générées, amplifiées ou propagées par des systèmes d'intelligence artificielle, q

Mistral AI : Définition et Exemples

Mistral AI est une entreprise française d'intelligence artificielle fondée en 2023, spécialisée dans le développement de grands modèles de langage (LLM) open so

Mixtral : Définition et Exemples

Mixtral est un modèle de langage open source développé par Mistral AI, basé sur une architecture Mixture of Experts (MoE) qui active sélectivement une partie de

Mixture Of Experts : Définition et Exemples

Architecture de réseau de neurones qui divise un modèle en plusieurs sous-réseaux spécialisés (les « experts ») et utilise un mécanisme de routage pour activer

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.