Memory System : Définition et Exemples
Mécanisme permettant à un modèle d'IA de conserver, organiser et réutiliser des informations au-delà d'une seule conversation, simulant une forme de mémoire persistante.
Définition complète
Un Memory System (système de mémoire) désigne l'ensemble des mécanismes techniques et architecturaux qui permettent à un modèle de langage de retenir des informations entre les interactions. Par défaut, les LLM sont « sans état » : chaque nouvelle conversation repart de zéro. Un système de mémoire vient combler cette limitation en stockant des données contextuelles — préférences utilisateur, historique de décisions, faits appris — dans des fichiers, bases de données ou embeddings vectoriels.
On distingue plusieurs niveaux de mémoire. La mémoire de contexte (in-context memory) correspond aux informations présentes dans la fenêtre de tokens active : instructions système, messages précédents, documents injectés. La mémoire persistante (persistent memory) va au-delà de la session en cours : elle repose sur des fichiers externes, des bases vectorielles ou des systèmes de retrieval (RAG) qui alimentent le modèle en informations pertinentes à chaque nouvelle requête.
Les systèmes de mémoire modernes s'organisent souvent par types : mémoire utilisateur (qui est l'interlocuteur, ses préférences), mémoire de projet (contexte métier, décisions en cours), mémoire de feedback (corrections passées à ne pas répéter) et mémoire de référence (où trouver l'information). Cette catégorisation permet au modèle de mobiliser le bon type d'information au bon moment.
L'enjeu central d'un Memory System est le compromis entre exhaustivité et pertinence. Stocker trop d'informations sature le contexte et dégrade les performances ; en stocker trop peu fait perdre la continuité. Les meilleures implémentations utilisent des index, des résumés et des mécanismes de recherche sémantique pour ne charger que les souvenirs réellement utiles à la tâche en cours.
Étymologie
Le terme emprunte au domaine des sciences cognitives, où le « memory system » désigne les structures cérébrales responsables de l'encodage, du stockage et de la récupération des souvenirs. En IA, il a été adopté pour décrire les architectures qui reproduisent ces fonctions de manière programmatique, notamment avec l'essor des agents autonomes en 2023-2024.
Exemples concrets
Assistant personnel avec mémoire persistante
Rappelle-toi que je préfère les réponses concises et que je travaille sur un projet Next.js. Utilise cette information dans nos futures conversations.
Agent de développement avec mémoire de feedback
La dernière fois tu as utilisé des mocks dans les tests alors que je t'avais dit de toujours utiliser la vraie base de données. Retiens cette consigne pour la suite.
Système RAG avec mémoire de référence
Quand je te pose des questions sur l'architecture du projet, consulte d'abord le fichier ARCHITECTURE.md et les notes de réunion stockées dans /docs/decisions/.
Usage pratique
En prompt engineering, exploitez les systèmes de mémoire en structurant explicitement les informations à retenir : séparez les faits durables (préférences, règles métier) des informations éphémères (tâche en cours). Utilisez des instructions système pour indiquer au modèle quand sauvegarder et quand consulter sa mémoire. Dans les architectures agentiques, combinez mémoire à court terme (contexte de conversation) et mémoire à long terme (base vectorielle ou fichiers indexés) pour maintenir la cohérence sur des projets complexes.
Concepts liés
FAQ
Quelle est la différence entre la fenêtre de contexte et un système de mémoire ?
Comment implémenter un système de mémoire simple pour un chatbot ?
Un système de mémoire rend-il le modèle plus intelligent ?
Voir aussi
Recevez de nouveaux prompts chaque semaine
Rejoignez notre newsletter.