Discriminative Model : Définition et Exemples

Un modèle discriminatif est un type de modèle d'apprentissage automatique qui apprend à distinguer et classifier des données en modélisant directement la frontière de décision entre les différentes classes.

Définition complète

Un modèle discriminatif (ou modèle discriminant) est une approche en machine learning qui se concentre sur l'apprentissage de la relation entre les données d'entrée et les étiquettes de sortie. Contrairement aux modèles génératifs qui cherchent à comprendre comment les données sont produites, un modèle discriminatif apprend directement la probabilité conditionnelle P(y|x), c'est-à-dire la probabilité qu'une sortie y corresponde à une entrée x donnée.

Concrètement, ces modèles tracent des frontières de décision dans l'espace des données pour séparer les différentes catégories. Par exemple, un modèle discriminatif entraîné à distinguer des emails spam des emails légitimes va apprendre les caractéristiques qui différencient ces deux classes, sans chercher à modéliser comment un email est composé en général. Cette approche ciblée les rend souvent plus performants pour les tâches de classification pure.

Parmi les exemples les plus connus de modèles discriminatifs, on trouve la régression logistique, les machines à vecteurs de support (SVM), les réseaux de neurones classiques utilisés pour la classification, les forêts aléatoires et les réseaux de neurones convolutifs (CNN) pour la reconnaissance d'images. Ces modèles sont omniprésents dans les applications industrielles d'IA.

Dans le contexte du prompt engineering, comprendre la distinction entre modèles discriminatifs et génératifs aide à mieux appréhender les capacités et les limites des grands modèles de langage (LLM). Les LLM comme Claude sont fondamentalement des modèles génératifs, mais ils peuvent accomplir des tâches discriminatives (classification, analyse de sentiment) lorsqu'on les guide correctement via des prompts bien construits.

Étymologie

Le terme « discriminatif » vient du latin « discriminare » signifiant « séparer, distinguer ». En machine learning, il a été adopté pour décrire les modèles qui « discriminent » entre les classes, c'est-à-dire qui apprennent à tracer des frontières de décision. La distinction formelle entre modèles discriminatifs et génératifs a été popularisée par Andrew Ng et Michael Jordan dans leur article de 2002 comparant les deux approches.

Exemples concrets

Classification de sentiment avec un LLM utilisé en mode discriminatif

Analyse le sentiment de l'avis client suivant et classe-le comme POSITIF, NÉGATIF ou NEUTRE. Réponds uniquement par la classe.

Avis : « Le produit est arrivé en retard mais la qualité est excellente, je suis globalement satisfait. »

Détection de spam en exploitant les capacités discriminatives d'un modèle génératif

Tu es un filtre anti-spam expert. Examine l'email suivant et détermine s'il est SPAM ou LÉGITIME. Explique les 3 critères principaux qui motivent ta décision.

Objet : « Félicitations ! Vous avez gagné 10 000€ »
Corps : « Cliquez ici pour réclamer votre prix... »

Comparaison pédagogique entre approche discriminative et générative

Explique-moi comme si j'avais 10 ans la différence entre un modèle discriminatif et un modèle génératif en IA. Utilise une analogie avec des animaux pour illustrer ton explication.

Usage pratique

En prompt engineering, on exploite les capacités discriminatives des LLM en formulant des tâches de classification claire avec des catégories bien définies. Pour obtenir les meilleurs résultats, il est recommandé de fournir des exemples de chaque classe (few-shot prompting) et de demander au modèle de justifier sa classification avant de donner sa réponse finale, ce qui améliore la précision grâce au raisonnement en chaîne.

Concepts liés

Generative ModelClassificationSupervised LearningNeural Network

FAQ

Quelle est la différence entre un modèle discriminatif et un modèle génératif ?

Un modèle discriminatif apprend à distinguer les classes en modélisant P(y|x), la probabilité d'une étiquette sachant les données. Un modèle génératif apprend comment les données sont produites en modélisant P(x|y) ou P(x,y), ce qui lui permet aussi de générer de nouvelles données. En pratique, les modèles discriminatifs sont souvent plus précis pour la classification, tandis que les modèles génératifs sont plus polyvalents.

Les grands modèles de langage comme Claude sont-ils des modèles discriminatifs ?

Non, les LLM comme Claude sont des modèles génératifs : ils apprennent à prédire le prochain token dans une séquence. Cependant, grâce au prompt engineering, on peut les utiliser efficacement pour des tâches discriminatives comme la classification de texte, la détection de sentiment ou le tri de données, en formulant ces tâches comme des problèmes de génération de texte.

Quels sont les modèles discriminatifs les plus utilisés en pratique ?

Les modèles discriminatifs les plus courants sont la régression logistique (simple et interprétable), les SVM (efficaces en haute dimension), les forêts aléatoires et le gradient boosting (XGBoost, LightGBM) pour les données tabulaires, et les réseaux de neurones profonds (CNN, transformers fine-tunés) pour les images et le texte. Le choix dépend du type de données, du volume disponible et des contraintes de déploiement.

Voir aussi

Generative Model Classification Supervised Learning Neural Network Few-Shot Prompting Logistic Regression

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.