P

Knowledge Cutoff : Définition et Exemples

Le knowledge cutoff (ou date de coupure des connaissances) désigne la date limite jusqu'à laquelle un modèle d'IA a été entraîné sur des données. Au-delà de cette date, le modèle n'a aucune connaissance des événements ou informations survenus.

Définition complète

Le knowledge cutoff est un concept fondamental pour comprendre les limites des grands modèles de langage (LLM). Chaque modèle d'IA est entraîné sur un corpus de données collectées jusqu'à une date précise. Cette date constitue sa "frontière temporelle" : tout ce qui s'est passé après lui est totalement inconnu.

Par exemple, si un modèle a un knowledge cutoff en avril 2024, il ne connaîtra pas les résultats d'une élection ayant eu lieu en novembre 2024, ni les dernières avancées scientifiques publiées après cette date. Il pourrait même fournir des informations obsolètes en toute confiance, car il n'a aucun moyen de savoir que ses données sont périmées.

Cette limitation a des implications pratiques majeures en prompt engineering. Lorsque vous interrogez un modèle sur des sujets d'actualité, des données récentes ou des événements postérieurs à sa date de coupure, les réponses peuvent être incorrectes ou inventées (hallucinations). C'est pourquoi il est essentiel de connaître le knowledge cutoff du modèle que vous utilisez.

Pour contourner cette limitation, plusieurs approches existent : le Retrieval-Augmented Generation (RAG) qui injecte des données à jour dans le contexte, la navigation web en temps réel intégrée à certains assistants, ou simplement le fait de fournir manuellement les informations récentes nécessaires dans votre prompt.

Étymologie

Le terme vient de l'anglais "knowledge" (connaissance) et "cutoff" (coupure, limite). Il est apparu avec la démocratisation des LLM vers 2022-2023 pour décrire de manière intuitive cette frontière temporelle inhérente à tout modèle entraîné sur un corpus figé. Le terme est généralement utilisé tel quel en français, bien qu'on trouve parfois "date de coupure des connaissances".

Exemples concrets

Vérifier les limites temporelles du modèle

Quelle est ta date de coupure des connaissances ? Quels événements majeurs de 2026 connais-tu ?

Fournir du contexte récent pour compenser le cutoff

Voici les résultats financiers du T1 2026 d'Apple : [données]. En te basant sur ces chiffres, analyse les tendances par rapport aux trimestres précédents que tu connais.

Éviter les hallucinations sur des sujets récents

Sans inventer d'informations, dis-moi ce que tu sais sur la réglementation européenne sur l'IA. Précise si tes informations risquent d'être obsolètes.

Usage pratique

En prompt engineering, tenez toujours compte du knowledge cutoff du modèle utilisé. Pour les sujets sensibles au temps, fournissez les données récentes directement dans le prompt ou utilisez des outils de recherche web. Ajoutez des instructions comme "Si tu n'es pas sûr de l'actualité de cette information, précise-le" pour limiter les hallucinations.

Concepts liés

Retrieval-Augmented Generation (RAG)HallucinationGroundingFine-tuning

FAQ

Comment connaître le knowledge cutoff d'un modèle ?
Vous pouvez simplement demander au modèle sa date de coupure des connaissances. Les fournisseurs (OpenAI, Anthropic, Google) publient également cette information dans leur documentation technique. Par exemple, Claude d'Anthropic indique généralement sa date de cutoff au début de la conversation.
Le knowledge cutoff signifie-t-il que le modèle ne sait rien après cette date ?
En principe, oui. Cependant, certains modèles bénéficient de mises à jour partielles ou d'outils de navigation web en temps réel qui leur permettent d'accéder à des informations plus récentes. Sans ces outils, le modèle n'a strictement aucune connaissance des événements postérieurs à sa date de coupure.
Comment contourner le knowledge cutoff dans mes prompts ?
Trois stratégies principales : injectez les informations récentes directement dans votre prompt ("Voici les dernières données..."), utilisez un système RAG qui récupère automatiquement des documents à jour, ou choisissez un assistant disposant d'un accès web en temps réel. Dans tous les cas, précisez au modèle quelles informations sont à jour pour qu'il s'y appuie en priorité.

Voir aussi

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.