GloVe : Définition et Exemples
GloVe (Global Vectors for Word Representation) est un algorithme d'apprentissage non supervisé développé par Stanford qui génère des représentations vectorielles de mots en exploitant les statistiques de co-occurrence dans un corpus de texte.
Définition complète
GloVe, acronyme de Global Vectors for Word Representation, est un modèle de plongement de mots (word embedding) créé en 2014 par Jeffrey Pennington, Richard Socher et Christopher Manning au laboratoire NLP de Stanford. Son objectif est de transformer chaque mot d'un vocabulaire en un vecteur numérique dense qui capture sa signification sémantique.
Contrairement à Word2Vec qui apprend les représentations à partir de fenêtres contextuelles locales, GloVe exploite une matrice globale de co-occurrence des mots sur l'ensemble du corpus. L'algorithme factorise cette matrice pour produire des vecteurs où les relations géométriques (distances, directions) entre vecteurs reflètent les relations sémantiques entre mots. Par exemple, la célèbre analogie vectorielle roi - homme + femme ≈ reine fonctionne remarquablement bien avec GloVe.
Le modèle repose sur l'intuition que le ratio des probabilités de co-occurrence entre deux mots par rapport à un troisième encode une information sémantique riche. GloVe optimise une fonction de coût qui préserve ces ratios dans l'espace vectoriel, combinant ainsi les avantages des méthodes de factorisation matricielle globale et des méthodes prédictives locales.
Bien que les modèles de langage modernes comme BERT ou GPT aient largement supplanté GloVe pour de nombreuses tâches NLP, il reste un outil fondamental pour comprendre les word embeddings. Ses vecteurs pré-entraînés (sur Wikipedia, Common Crawl) sont encore utilisés comme point de départ dans certaines applications, et sa simplicité en fait un excellent outil pédagogique pour appréhender la représentation vectorielle du langage.
Étymologie
GloVe est un acronyme de « Global Vectors for Word Representation » (vecteurs globaux pour la représentation des mots). Le nom souligne la différence clé avec Word2Vec : l'utilisation de statistiques globales du corpus plutôt que de contextes locaux.
Exemples concrets
Analyse de similarité sémantique entre mots
En utilisant des embeddings GloVe, calcule la similarité cosinus entre les mots 'roi', 'reine', 'prince' et 'princesse'. Explique les relations sémantiques que les vecteurs capturent.
Classification de texte avec embeddings pré-entraînés
Conçois un classifieur de sentiments pour des avis clients en utilisant des embeddings GloVe 300d pré-entraînés comme couche d'entrée. Décris l'architecture et les étapes de prétraitement.
Détection de biais dans les représentations vectorielles
Analyse les biais de genre présents dans les vecteurs GloVe entraînés sur Common Crawl. Quelles associations stéréotypées peut-on observer et comment les atténuer ?
Usage pratique
En prompt engineering, comprendre GloVe aide à saisir comment les modèles de langage représentent les mots et leurs relations sémantiques. Lorsque vous formulez des prompts exploitant des analogies ou des relations entre concepts, vous tirez parti de mécanismes similaires à ceux de GloVe. Savoir que les embeddings capturent des biais du corpus d'entraînement permet aussi de mieux anticiper et corriger les biais dans les réponses générées.
Concepts liés
FAQ
Quelle est la différence entre GloVe et Word2Vec ?
GloVe est-il encore utilisé avec les modèles modernes comme GPT ou BERT ?
Comment les vecteurs GloVe capturent-ils le sens des mots ?
Voir aussi
Recevez de nouveaux prompts chaque semaine
Rejoignez notre newsletter.