Question 1

Quelle est la différence entre un modèle encoder-only, decoder-only et encoder-decoder ?

Accepted Answer

Un modèle encoder-only (comme BERT) excelle en compréhension : classification, analyse de sentiment, recherche sémantique. Un modèle decoder-only (comme GPT ou Claude) est optimisé pour la génération de texte. Un modèle encoder-decoder (comme T5 ou BART) combine les deux et excelle dans les tâches de transformation où l'entrée et la sortie sont de natures différentes, comme la traduction ou le résumé.

Question 2

Pourquoi les modèles les plus récents comme GPT-4 et Claude n'utilisent-ils que le décodeur ?

Accepted Answer

Les modèles decoder-only se sont révélés remarquablement polyvalents grâce au scaling (augmentation de la taille et des données). En formulant toute tâche comme de la génération de texte conditionnée par un prompt, ils parviennent à égaler voire surpasser les modèles encoder-decoder sur la plupart des tâches, tout en étant plus simples à entraîner et à déployer. Le prompt joue alors le rôle d'encodeur implicite.

Question 3

L'architecture encoder-decoder est-elle encore pertinente aujourd'hui ?

Accepted Answer

Oui, elle reste très pertinente dans plusieurs domaines. En traduction automatique spécialisée, en reconnaissance vocale (Whisper d'OpenAI utilise un encoder-decoder), en vision par ordinateur et dans les applications industrielles nécessitant des modèles compacts et efficaces. Elle est aussi privilégiée quand la tâche implique une transformation structurée entre deux formats bien définis.

Encoder Decoder : Définition et Exemples

Définition complète

Étymologie

Exemples concrets

Usage pratique

Concepts liés

FAQ

Voir aussi

Recevez de nouveaux prompts chaque semaine