Question 1

Quelle est la différence entre context window et mémoire du modèle ?

Accepted Answer

La context window est la mémoire de travail temporaire du modèle, active uniquement pendant une interaction. Elle ne persiste pas entre les conversations. La "mémoire" au sens large inclut aussi les connaissances acquises pendant l'entraînement, qui sont permanentes mais figées. Certains systèmes ajoutent une couche de mémoire persistante par-dessus (historique de conversations, bases vectorielles), mais cela reste distinct de la context window native.

Question 2

Que se passe-t-il quand on dépasse la taille de la context window ?

Accepted Answer

Lorsque le contenu dépasse la context window, le comportement varie selon le système. Certains modèles tronquent silencieusement les tokens les plus anciens, d'autres renvoient une erreur. Dans tous les cas, les informations au-delà de la limite sont perdues pour le modèle, ce qui peut entraîner des réponses incomplètes, incohérentes ou qui ignorent des instructions importantes. C'est pourquoi il est crucial de structurer ses prompts pour que les éléments essentiels restent dans la fenêtre.

Question 3

Une context window plus grande signifie-t-elle toujours de meilleures réponses ?

Accepted Answer

Pas nécessairement. Des recherches ont montré un phénomène appelé "lost in the middle" : les modèles ont tendance à moins bien exploiter les informations situées au milieu de très longs contextes. De plus, une fenêtre plus grande augmente le coût en tokens et le temps de traitement. L'approche optimale consiste souvent à fournir uniquement les informations pertinentes, bien structurées, plutôt que de remplir la fenêtre au maximum.

Context Window : Définition et Exemples

Définition complète

Étymologie

Exemples concrets

Usage pratique

Concepts liés

FAQ

Voir aussi

Recevez de nouveaux prompts chaque semaine