Knowledge Cutoff : Définition et Exemples
Le knowledge cutoff (ou date de coupure des connaissances) désigne la date limite jusqu'à laquelle un modèle d'IA a été entraîné sur des données. Au-delà de cette date, le modèle n'a aucune connaissance des événements ou informations survenus.
Définition complète
Le knowledge cutoff est un concept fondamental pour comprendre les limites des grands modèles de langage (LLM). Chaque modèle d'IA est entraîné sur un corpus de données collectées jusqu'à une date précise. Cette date constitue sa "frontière temporelle" : tout ce qui s'est passé après lui est totalement inconnu.
Par exemple, si un modèle a un knowledge cutoff en avril 2024, il ne connaîtra pas les résultats d'une élection ayant eu lieu en novembre 2024, ni les dernières avancées scientifiques publiées après cette date. Il pourrait même fournir des informations obsolètes en toute confiance, car il n'a aucun moyen de savoir que ses données sont périmées.
Cette limitation a des implications pratiques majeures en prompt engineering. Lorsque vous interrogez un modèle sur des sujets d'actualité, des données récentes ou des événements postérieurs à sa date de coupure, les réponses peuvent être incorrectes ou inventées (hallucinations). C'est pourquoi il est essentiel de connaître le knowledge cutoff du modèle que vous utilisez.
Pour contourner cette limitation, plusieurs approches existent : le Retrieval-Augmented Generation (RAG) qui injecte des données à jour dans le contexte, la navigation web en temps réel intégrée à certains assistants, ou simplement le fait de fournir manuellement les informations récentes nécessaires dans votre prompt.
Étymologie
Le terme vient de l'anglais "knowledge" (connaissance) et "cutoff" (coupure, limite). Il est apparu avec la démocratisation des LLM vers 2022-2023 pour décrire de manière intuitive cette frontière temporelle inhérente à tout modèle entraîné sur un corpus figé. Le terme est généralement utilisé tel quel en français, bien qu'on trouve parfois "date de coupure des connaissances".
Exemples concrets
Vérifier les limites temporelles du modèle
Quelle est ta date de coupure des connaissances ? Quels événements majeurs de 2026 connais-tu ?
Fournir du contexte récent pour compenser le cutoff
Voici les résultats financiers du T1 2026 d'Apple : [données]. En te basant sur ces chiffres, analyse les tendances par rapport aux trimestres précédents que tu connais.
Éviter les hallucinations sur des sujets récents
Sans inventer d'informations, dis-moi ce que tu sais sur la réglementation européenne sur l'IA. Précise si tes informations risquent d'être obsolètes.
Usage pratique
En prompt engineering, tenez toujours compte du knowledge cutoff du modèle utilisé. Pour les sujets sensibles au temps, fournissez les données récentes directement dans le prompt ou utilisez des outils de recherche web. Ajoutez des instructions comme "Si tu n'es pas sûr de l'actualité de cette information, précise-le" pour limiter les hallucinations.
Concepts liés
FAQ
Comment connaître le knowledge cutoff d'un modèle ?
Le knowledge cutoff signifie-t-il que le modèle ne sait rien après cette date ?
Comment contourner le knowledge cutoff dans mes prompts ?
Voir aussi
Recevez de nouveaux prompts chaque semaine
Rejoignez notre newsletter.