GloVe : Définition et Exemples

GloVe (Global Vectors for Word Representation) est un algorithme d'apprentissage non supervisé développé par Stanford qui génère des représentations vectorielles de mots en exploitant les statistiques de co-occurrence dans un corpus de texte.

Définition complète

GloVe, acronyme de Global Vectors for Word Representation, est un modèle de plongement de mots (word embedding) créé en 2014 par Jeffrey Pennington, Richard Socher et Christopher Manning au laboratoire NLP de Stanford. Son objectif est de transformer chaque mot d'un vocabulaire en un vecteur numérique dense qui capture sa signification sémantique.

Contrairement à Word2Vec qui apprend les représentations à partir de fenêtres contextuelles locales, GloVe exploite une matrice globale de co-occurrence des mots sur l'ensemble du corpus. L'algorithme factorise cette matrice pour produire des vecteurs où les relations géométriques (distances, directions) entre vecteurs reflètent les relations sémantiques entre mots. Par exemple, la célèbre analogie vectorielle roi - homme + femme ≈ reine fonctionne remarquablement bien avec GloVe.

Le modèle repose sur l'intuition que le ratio des probabilités de co-occurrence entre deux mots par rapport à un troisième encode une information sémantique riche. GloVe optimise une fonction de coût qui préserve ces ratios dans l'espace vectoriel, combinant ainsi les avantages des méthodes de factorisation matricielle globale et des méthodes prédictives locales.

Bien que les modèles de langage modernes comme BERT ou GPT aient largement supplanté GloVe pour de nombreuses tâches NLP, il reste un outil fondamental pour comprendre les word embeddings. Ses vecteurs pré-entraînés (sur Wikipedia, Common Crawl) sont encore utilisés comme point de départ dans certaines applications, et sa simplicité en fait un excellent outil pédagogique pour appréhender la représentation vectorielle du langage.

Étymologie

GloVe est un acronyme de « Global Vectors for Word Representation » (vecteurs globaux pour la représentation des mots). Le nom souligne la différence clé avec Word2Vec : l'utilisation de statistiques globales du corpus plutôt que de contextes locaux.

Exemples concrets

Analyse de similarité sémantique entre mots

En utilisant des embeddings GloVe, calcule la similarité cosinus entre les mots 'roi', 'reine', 'prince' et 'princesse'. Explique les relations sémantiques que les vecteurs capturent.

Classification de texte avec embeddings pré-entraînés

Conçois un classifieur de sentiments pour des avis clients en utilisant des embeddings GloVe 300d pré-entraînés comme couche d'entrée. Décris l'architecture et les étapes de prétraitement.

Détection de biais dans les représentations vectorielles

Analyse les biais de genre présents dans les vecteurs GloVe entraînés sur Common Crawl. Quelles associations stéréotypées peut-on observer et comment les atténuer ?

Usage pratique

En prompt engineering, comprendre GloVe aide à saisir comment les modèles de langage représentent les mots et leurs relations sémantiques. Lorsque vous formulez des prompts exploitant des analogies ou des relations entre concepts, vous tirez parti de mécanismes similaires à ceux de GloVe. Savoir que les embeddings capturent des biais du corpus d'entraînement permet aussi de mieux anticiper et corriger les biais dans les réponses générées.

Concepts liés

Word2VecWord EmbeddingSimilarité cosinusTransformer

FAQ

Quelle est la différence entre GloVe et Word2Vec ?

Word2Vec apprend les représentations de mots à partir de fenêtres contextuelles locales (méthode prédictive), tandis que GloVe exploite une matrice de co-occurrence globale sur tout le corpus (méthode par comptage). GloVe combine ainsi les avantages des approches statistiques globales et des méthodes d'apprentissage par contexte, ce qui lui permet souvent d'obtenir de meilleures performances sur les tâches d'analogie.

GloVe est-il encore utilisé avec les modèles modernes comme GPT ou BERT ?

Les modèles modernes de type Transformer génèrent leurs propres embeddings contextuels, rendant GloVe moins nécessaire pour les tâches de pointe. Cependant, GloVe reste utile dans des scénarios à ressources limitées, comme outil pédagogique pour comprendre les embeddings, et comme baseline pour comparer les performances de modèles plus complexes.

Comment les vecteurs GloVe capturent-ils le sens des mots ?

GloVe analyse la fréquence à laquelle les mots apparaissent ensemble dans un corpus. Les mots partageant des contextes similaires obtiennent des vecteurs proches. L'algorithme optimise les vecteurs pour que leur produit scalaire corresponde au logarithme de leur probabilité de co-occurrence, préservant ainsi les relations sémantiques dans la géométrie de l'espace vectoriel.

Voir aussi

Word2Vec Embedding NLP Transformer Similarité cosinus Tokenization

Comment utiliser ce prompt

Copie le prompt avec le bouton ci-dessus.
Colle-le dans ChatGPT, Claude ou ton assistant IA préféré.
Remplace les variables entre crochets par tes informations, puis affine le résultat.

À propos de Prompt Guide

Prompt Guide est une bibliothèque gratuite de plus de 2500 prompts prêts à l'emploi pour ChatGPT, Claude et les autres IA, avec des guides pour apprendre à prompter et des outils pour créer et optimiser tes propres prompts.

Bibliothèque de prompts Apprendre à prompter Constructeur de prompt Optimiseur de prompt

Autres définitions

Google DeepMind : Définition et Exemples

Google DeepMind est le laboratoire de recherche en intelligence artificielle de Google, né de la fusion entre DeepMind Technologies et Google Brain en 2023, rec

GPT 4 : Définition et Exemples

GPT-4 est un modèle de langage multimodal développé par OpenAI, capable de comprendre du texte et des images pour générer des réponses d'une qualité et d'une pr

GPT 4o : Définition et Exemples

GPT-4o (« o » pour « omni ») est le modèle multimodal phare d'OpenAI, capable de traiter et de générer du texte, des images et de l'audio au sein d'une même arc

Gradient Descent : Définition et Exemples

Le Gradient Descent (descente de gradient) est un algorithme d'optimisation itératif utilisé pour minimiser une fonction de coût en ajustant progressivement les

Grounding : Définition et Exemples

Le grounding (ancrage) est une technique qui consiste à fournir au modèle d'IA des données factuelles, des documents ou un contexte concret pour que ses réponse

Grouped Query Attention : Définition et Exemples

Mécanisme d'attention qui regroupe plusieurs têtes de requête (query heads) pour partager les mêmes clés et valeurs, réduisant ainsi la mémoire et le coût de ca

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.