Self Consistency : Définition et Exemples
Technique de prompting qui consiste à générer plusieurs raisonnements indépendants pour une même question, puis à sélectionner la réponse la plus fréquente par vote majoritaire, améliorant ainsi la fiabilité des résultats.
Définition complète
La Self Consistency (ou auto-cohérence) est une méthode avancée de prompting introduite par Wang et al. en 2022. Elle repose sur un principe simple mais puissant : plutôt que de se fier à une seule réponse générée par un modèle de langage, on lui demande de produire plusieurs chaînes de raisonnement différentes pour le même problème, puis on retient la réponse qui revient le plus souvent.
Cette approche s'appuie sur l'intuition que si plusieurs chemins de raisonnement indépendants convergent vers la même conclusion, celle-ci a de fortes chances d'être correcte. C'est comparable à demander l'avis de plusieurs experts : si la majorité arrive à la même réponse par des voies différentes, on peut lui accorder davantage de confiance.
Concrètement, la Self Consistency fonctionne en trois étapes. D'abord, on utilise un prompt de type Chain-of-Thought pour encourager le raisonnement étape par étape. Ensuite, on génère plusieurs réponses en augmentant le paramètre de température pour introduire de la diversité dans les raisonnements. Enfin, on applique un vote majoritaire sur les réponses finales pour déterminer la plus cohérente.
Cette technique est particulièrement efficace pour les tâches de raisonnement mathématique, logique et de bon sens, où elle surpasse significativement le Chain-of-Thought classique. Elle permet de réduire les erreurs aléatoires dues à un mauvais chemin de raisonnement, sans nécessiter d'entraînement supplémentaire du modèle.
Étymologie
Le terme "Self Consistency" (auto-cohérence) provient de l'article de recherche "Self-Consistency Improves Chain of Thought Reasoning in Language Models" publié par Xuezhi Wang et al. en 2022. Le nom reflète l'idée centrale de la méthode : vérifier la cohérence interne du modèle avec lui-même en comparant plusieurs de ses propres raisonnements.
Exemples concrets
Résolution d'un problème mathématique complexe
Résous ce problème étape par étape : Un magasin offre 25% de réduction sur un article à 80€, puis applique une remise supplémentaire de 10%. Quel est le prix final ? Génère 5 raisonnements différents et donne la réponse la plus fréquente.
Question de raisonnement logique avec ambiguïté
Raisonne de 3 manières différentes pour répondre : Si tous les bloops sont des razzies et que tous les razzies sont des lazzies, est-ce que tous les bloops sont des lazzies ? Donne ta réponse finale basée sur le consensus.
Classification de sentiment sur un texte ambigu
Analyse le sentiment de cette phrase de 5 façons différentes en considérant divers angles d'interprétation : 'Ce restaurant n'est pas mauvais, mais je ne suis pas sûr d'y retourner.' Quelle est la classification majoritaire ?
Usage pratique
Pour appliquer la Self Consistency, configurez une température élevée (0.7-1.0) et demandez au modèle de générer 5 à 10 réponses indépendantes avec raisonnement explicite. Comptez ensuite quelle réponse finale apparaît le plus souvent. Cette technique est idéale pour les questions factuelles ou mathématiques où une réponse unique risque d'être erronée, mais elle augmente le coût en tokens proportionnellement au nombre de générations.
Concepts liés
FAQ
Quelle est la différence entre Self Consistency et Chain-of-Thought ?
Combien de raisonnements faut-il générer pour que la Self Consistency soit efficace ?
La Self Consistency fonctionne-t-elle pour tous les types de tâches ?
Voir aussi
Recevez de nouveaux prompts chaque semaine
Rejoignez notre newsletter.