Question 1

Quelle est la différence entre Self Attention et Cross Attention ?

Accepted Answer

Le Self Attention permet à une séquence de s'analyser elle-même : chaque élément regarde tous les autres éléments de la même séquence. Le Cross Attention, en revanche, met en relation deux séquences distinctes : les requêtes viennent d'une séquence et les clés/valeurs d'une autre. Par exemple, dans un traducteur, le Self Attention analyse la phrase source en interne, puis le Cross Attention permet à la phrase cible en cours de génération de consulter cette phrase source.

Question 2

Pourquoi le Cross Attention est-il si important dans la génération d'images par IA ?

Accepted Answer

Dans les modèles comme Stable Diffusion, le Cross Attention est le pont entre le texte du prompt et l'image générée. C'est lui qui détermine comment chaque mot influence chaque zone de l'image. Sans ce mécanisme, le modèle ne pourrait pas traduire fidèlement les instructions textuelles en contenu visuel. C'est aussi pourquoi des techniques comme le prompt weighting (pondération de mots) fonctionnent : elles modifient directement les scores de cross attention.

Question 3

Comment le Cross Attention influence-t-il la rédaction de prompts ?

Accepted Answer

Le Cross Attention traite chaque token du prompt individuellement pour calculer des scores d'attention avec le contenu généré. Cela signifie que la clarté et la séparation des concepts dans un prompt sont cruciales. Des instructions ambiguës ou fusionnées peuvent créer des interférences dans les scores d'attention. Séparer les concepts par des virgules, utiliser des parenthèses pour grouper des idées, et placer les éléments importants en début de prompt sont des stratégies directement liées au fonctionnement du cross attention.

Cross Attention : Définition et Exemples

Définition complète

Étymologie

Exemples concrets

Usage pratique

Concepts liés

FAQ

Voir aussi

Recevez de nouveaux prompts chaque semaine