Question 1

Quelle est la différence entre une loss function et une métrique d'évaluation ?

Accepted Answer

La loss function est utilisée pendant l'entraînement pour guider l'optimisation des poids du modèle — elle doit être dérivable mathématiquement. La métrique d'évaluation (accuracy, F1-score, BLEU) est utilisée après l'entraînement pour juger la performance du modèle en termes compréhensibles par les humains. Parfois elles coïncident, mais souvent la métrique business n'est pas directement optimisable comme loss function.

Question 2

Pourquoi les LLM comme ChatGPT utilisent-ils la cross-entropy loss ?

Accepted Answer

Les grands modèles de langage sont entraînés à prédire le token suivant dans une séquence de texte. La cross-entropy loss est idéale pour cette tâche car elle mesure la divergence entre la distribution de probabilité prédite par le modèle sur l'ensemble du vocabulaire et la distribution réelle (le token correct). Elle pénalise particulièrement les prédictions confiantes mais erronées, ce qui pousse le modèle à calibrer correctement ses probabilités.

Question 3

Comment le RLHF modifie-t-il la loss function des modèles de langage ?

Accepted Answer

Le RLHF (Reinforcement Learning from Human Feedback) ajoute une couche supplémentaire à l'entraînement. Au lieu de minimiser uniquement la cross-entropy, le modèle est affiné avec une loss function basée sur les préférences humaines. Un modèle de récompense (reward model) est d'abord entraîné sur des comparaisons humaines, puis le LLM est optimisé via PPO pour maximiser cette récompense tout en restant proche du modèle de base. C'est ce processus qui rend les modèles plus utiles et alignés avec les intentions des utilisateurs.

Loss Function : Définition et Exemples

Définition complète

Étymologie

Exemples concrets

Usage pratique

Concepts liés

FAQ

Voir aussi

Recevez de nouveaux prompts chaque semaine