P

Self Consistency : Définition et Exemples

Technique de prompting qui consiste à générer plusieurs raisonnements indépendants pour une même question, puis à sélectionner la réponse la plus fréquente par vote majoritaire, améliorant ainsi la fiabilité des résultats.

Définition complète

La Self Consistency (ou auto-cohérence) est une méthode avancée de prompting introduite par Wang et al. en 2022. Elle repose sur un principe simple mais puissant : plutôt que de se fier à une seule réponse générée par un modèle de langage, on lui demande de produire plusieurs chaînes de raisonnement différentes pour le même problème, puis on retient la réponse qui revient le plus souvent.

Cette approche s'appuie sur l'intuition que si plusieurs chemins de raisonnement indépendants convergent vers la même conclusion, celle-ci a de fortes chances d'être correcte. C'est comparable à demander l'avis de plusieurs experts : si la majorité arrive à la même réponse par des voies différentes, on peut lui accorder davantage de confiance.

Concrètement, la Self Consistency fonctionne en trois étapes. D'abord, on utilise un prompt de type Chain-of-Thought pour encourager le raisonnement étape par étape. Ensuite, on génère plusieurs réponses en augmentant le paramètre de température pour introduire de la diversité dans les raisonnements. Enfin, on applique un vote majoritaire sur les réponses finales pour déterminer la plus cohérente.

Cette technique est particulièrement efficace pour les tâches de raisonnement mathématique, logique et de bon sens, où elle surpasse significativement le Chain-of-Thought classique. Elle permet de réduire les erreurs aléatoires dues à un mauvais chemin de raisonnement, sans nécessiter d'entraînement supplémentaire du modèle.

Étymologie

Le terme "Self Consistency" (auto-cohérence) provient de l'article de recherche "Self-Consistency Improves Chain of Thought Reasoning in Language Models" publié par Xuezhi Wang et al. en 2022. Le nom reflète l'idée centrale de la méthode : vérifier la cohérence interne du modèle avec lui-même en comparant plusieurs de ses propres raisonnements.

Exemples concrets

Résolution d'un problème mathématique complexe

Résous ce problème étape par étape : Un magasin offre 25% de réduction sur un article à 80€, puis applique une remise supplémentaire de 10%. Quel est le prix final ? Génère 5 raisonnements différents et donne la réponse la plus fréquente.

Question de raisonnement logique avec ambiguïté

Raisonne de 3 manières différentes pour répondre : Si tous les bloops sont des razzies et que tous les razzies sont des lazzies, est-ce que tous les bloops sont des lazzies ? Donne ta réponse finale basée sur le consensus.

Classification de sentiment sur un texte ambigu

Analyse le sentiment de cette phrase de 5 façons différentes en considérant divers angles d'interprétation : 'Ce restaurant n'est pas mauvais, mais je ne suis pas sûr d'y retourner.' Quelle est la classification majoritaire ?

Usage pratique

Pour appliquer la Self Consistency, configurez une température élevée (0.7-1.0) et demandez au modèle de générer 5 à 10 réponses indépendantes avec raisonnement explicite. Comptez ensuite quelle réponse finale apparaît le plus souvent. Cette technique est idéale pour les questions factuelles ou mathématiques où une réponse unique risque d'être erronée, mais elle augmente le coût en tokens proportionnellement au nombre de générations.

Concepts liés

Chain-of-ThoughtTree of ThoughtsEnsemble LearningVote majoritaire

FAQ

Quelle est la différence entre Self Consistency et Chain-of-Thought ?
Le Chain-of-Thought génère un seul raisonnement étape par étape, tandis que la Self Consistency génère plusieurs raisonnements Chain-of-Thought indépendants et sélectionne la réponse majoritaire. La Self Consistency est une extension du Chain-of-Thought qui améliore sa fiabilité grâce à l'agrégation de multiples réponses.
Combien de raisonnements faut-il générer pour que la Self Consistency soit efficace ?
Les recherches montrent que 5 à 10 raisonnements offrent un bon équilibre entre amélioration de la précision et coût en tokens. Au-delà de 20 échantillons, les gains marginaux deviennent faibles. Pour des problèmes simples, 5 suffisent ; pour des problèmes complexes, 10 à 15 peuvent être nécessaires.
La Self Consistency fonctionne-t-elle pour tous les types de tâches ?
La Self Consistency est surtout efficace pour les tâches ayant une réponse précise et vérifiable : mathématiques, logique, questions factuelles. Elle est moins adaptée aux tâches créatives ou ouvertes (rédaction, brainstorming) où il n'y a pas de réponse unique correcte et où la diversité des réponses est justement souhaitée.

Voir aussi

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.