Self Consistency : Définition et Exemples

Technique de prompting qui consiste à générer plusieurs raisonnements indépendants pour une même question, puis à sélectionner la réponse la plus fréquente par vote majoritaire, améliorant ainsi la fiabilité des résultats.

Définition complète

La Self Consistency (ou auto-cohérence) est une méthode avancée de prompting introduite par Wang et al. en 2022. Elle repose sur un principe simple mais puissant : plutôt que de se fier à une seule réponse générée par un modèle de langage, on lui demande de produire plusieurs chaînes de raisonnement différentes pour le même problème, puis on retient la réponse qui revient le plus souvent.

Cette approche s'appuie sur l'intuition que si plusieurs chemins de raisonnement indépendants convergent vers la même conclusion, celle-ci a de fortes chances d'être correcte. C'est comparable à demander l'avis de plusieurs experts : si la majorité arrive à la même réponse par des voies différentes, on peut lui accorder davantage de confiance.

Concrètement, la Self Consistency fonctionne en trois étapes. D'abord, on utilise un prompt de type Chain-of-Thought pour encourager le raisonnement étape par étape. Ensuite, on génère plusieurs réponses en augmentant le paramètre de température pour introduire de la diversité dans les raisonnements. Enfin, on applique un vote majoritaire sur les réponses finales pour déterminer la plus cohérente.

Cette technique est particulièrement efficace pour les tâches de raisonnement mathématique, logique et de bon sens, où elle surpasse significativement le Chain-of-Thought classique. Elle permet de réduire les erreurs aléatoires dues à un mauvais chemin de raisonnement, sans nécessiter d'entraînement supplémentaire du modèle.

Étymologie

Le terme "Self Consistency" (auto-cohérence) provient de l'article de recherche "Self-Consistency Improves Chain of Thought Reasoning in Language Models" publié par Xuezhi Wang et al. en 2022. Le nom reflète l'idée centrale de la méthode : vérifier la cohérence interne du modèle avec lui-même en comparant plusieurs de ses propres raisonnements.

Exemples concrets

Résolution d'un problème mathématique complexe

Résous ce problème étape par étape : Un magasin offre 25% de réduction sur un article à 80€, puis applique une remise supplémentaire de 10%. Quel est le prix final ? Génère 5 raisonnements différents et donne la réponse la plus fréquente.

Question de raisonnement logique avec ambiguïté

Raisonne de 3 manières différentes pour répondre : Si tous les bloops sont des razzies et que tous les razzies sont des lazzies, est-ce que tous les bloops sont des lazzies ? Donne ta réponse finale basée sur le consensus.

Classification de sentiment sur un texte ambigu

Analyse le sentiment de cette phrase de 5 façons différentes en considérant divers angles d'interprétation : 'Ce restaurant n'est pas mauvais, mais je ne suis pas sûr d'y retourner.' Quelle est la classification majoritaire ?

Usage pratique

Pour appliquer la Self Consistency, configurez une température élevée (0.7-1.0) et demandez au modèle de générer 5 à 10 réponses indépendantes avec raisonnement explicite. Comptez ensuite quelle réponse finale apparaît le plus souvent. Cette technique est idéale pour les questions factuelles ou mathématiques où une réponse unique risque d'être erronée, mais elle augmente le coût en tokens proportionnellement au nombre de générations.

Concepts liés

Chain-of-ThoughtTree of ThoughtsEnsemble LearningVote majoritaire

FAQ

Quelle est la différence entre Self Consistency et Chain-of-Thought ?

Le Chain-of-Thought génère un seul raisonnement étape par étape, tandis que la Self Consistency génère plusieurs raisonnements Chain-of-Thought indépendants et sélectionne la réponse majoritaire. La Self Consistency est une extension du Chain-of-Thought qui améliore sa fiabilité grâce à l'agrégation de multiples réponses.

Combien de raisonnements faut-il générer pour que la Self Consistency soit efficace ?

Les recherches montrent que 5 à 10 raisonnements offrent un bon équilibre entre amélioration de la précision et coût en tokens. Au-delà de 20 échantillons, les gains marginaux deviennent faibles. Pour des problèmes simples, 5 suffisent ; pour des problèmes complexes, 10 à 15 peuvent être nécessaires.

La Self Consistency fonctionne-t-elle pour tous les types de tâches ?

La Self Consistency est surtout efficace pour les tâches ayant une réponse précise et vérifiable : mathématiques, logique, questions factuelles. Elle est moins adaptée aux tâches créatives ou ouvertes (rédaction, brainstorming) où il n'y a pas de réponse unique correcte et où la diversité des réponses est justement souhaitée.

Voir aussi

Chain-of-Thought Tree of Thoughts Température Few-Shot Prompting Raisonnement Prompt Engineering

Autres définitions

Self Refine : Définition et Exemples

Le Self Refine est une technique où un modèle de langage génère une réponse initiale, puis l'évalue et l'améliore de manière itérative sans intervention humaine

Semantic Cache : Définition et Exemples

Un semantic cache est un système de mise en cache qui stocke et retrouve des réponses de modèles d'IA en se basant sur la similarité sémantique des requêtes, pl

Semantic Kernel : Définition et Exemples

Semantic Kernel est un SDK open source développé par Microsoft qui permet d'intégrer des modèles de langage (LLM) dans des applications traditionnelles en orche

Semantic Search : Définition et Exemples

La recherche sémantique est une technique de recherche d'information qui comprend le sens et l'intention derrière une requête, plutôt que de se limiter à la cor

SentencePiece : Définition et Exemples

SentencePiece est une bibliothèque open source de tokenization développée par Google, qui découpe le texte en sous-unités (subwords) de manière indépendante de

Sentiment Analysis : Définition et Exemples

La sentiment analysis (ou analyse de sentiments) est une technique de traitement du langage naturel (NLP) qui identifie et extrait automatiquement les opinions,

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.