P

Model Registry : Définition et Exemples

Un Model Registry est un système centralisé permettant de stocker, versionner et gérer les modèles de machine learning tout au long de leur cycle de vie, de l'entraînement au déploiement en production.

Définition complète

Un Model Registry (registre de modèles) est une plateforme centralisée qui sert de catalogue organisé pour tous les modèles de machine learning d'une organisation. Il permet aux équipes de data science et d'ingénierie ML de stocker chaque version d'un modèle avec ses métadonnées associées : hyperparamètres, métriques de performance, jeux de données d'entraînement et artefacts connexes.

Le Model Registry joue un rôle clé dans le MLOps en apportant de la traçabilité et de la gouvernance au cycle de vie des modèles. Chaque modèle enregistré passe par différents stades — développement, staging, production, archivé — ce qui permet aux équipes de savoir exactement quel modèle est déployé, quand il a été mis à jour et par qui. Cette approche élimine le chaos des modèles stockés dans des dossiers personnels ou des notebooks éparpillés.

Dans le contexte du prompt engineering, le Model Registry prend une importance particulière car il permet de documenter quel modèle de langage (GPT-4, Claude, Mistral, etc.) est utilisé pour chaque application, avec quelle version et quels prompts système associés. Cela garantit la reproductibilité des résultats et facilite les comparaisons entre différentes configurations.

Les solutions les plus populaires incluent MLflow Model Registry, Amazon SageMaker Model Registry, Weights & Biases et Hugging Face Hub. Chacune offre des fonctionnalités de versionnement, de collaboration et d'intégration CI/CD adaptées à différentes échelles d'organisation.

Étymologie

Le terme combine « Model » (modèle, issu du latin modulus signifiant « mesure » ou « étalon ») et « Registry » (registre, du latin regestum signifiant « liste » ou « catalogue officiel »). L'expression est née dans l'écosystème MLOps vers 2018-2019, par analogie avec les registres de conteneurs (Container Registry) utilisés en DevOps pour stocker et versionner les images Docker.

Exemples concrets

Comparaison de modèles pour une application de chatbot

Je dispose de trois modèles fine-tunés dans mon registry (v1.2, v1.3, v1.4). Compare leurs métriques de performance sur le jeu de test de satisfaction client et recommande lequel promouvoir en production.

Documentation d'un déploiement en production

Génère une fiche de déploiement pour le modèle de classification de tickets enregistré sous l'ID 'ticket-classifier-v2.1' dans notre Model Registry, incluant les dépendances, les métriques de validation et les instructions de rollback.

Audit de conformité des modèles déployés

À partir de la liste des modèles actifs dans notre registry, identifie ceux qui n'ont pas été réévalués depuis plus de 90 jours et propose un plan de revalidation priorisé.

Usage pratique

En prompt engineering, utilisez un Model Registry pour documenter systématiquement chaque combinaison modèle + prompt système + paramètres (température, top-p) qui donne de bons résultats. Cela vous permet de reproduire fidèlement vos expérimentations et de revenir à une version antérieure si une mise à jour dégrade les performances. Intégrez votre registry dans un pipeline CI/CD pour automatiser les tests de non-régression à chaque changement de prompt ou de modèle.

Concepts liés

MLOpsModel VersioningFeature StoreModel Serving

FAQ

Quelle est la différence entre un Model Registry et un simple stockage de fichiers ?
Un Model Registry va bien au-delà du stockage de fichiers. Il offre le versionnement sémantique, le suivi des métadonnées (métriques, paramètres, lignage des données), la gestion des transitions d'état (staging, production, archivé), le contrôle d'accès et l'intégration avec les pipelines de déploiement. Un dossier partagé ne fournit aucune de ces fonctionnalités essentielles à la gouvernance des modèles.
Ai-je besoin d'un Model Registry si j'utilise uniquement des API de LLM comme Claude ou GPT ?
Oui, même sans modèles entraînés en interne, un registry reste utile pour suivre vos configurations : quel modèle API est appelé, avec quels prompts système, quels paramètres et quelles performances observées. Des outils comme LangSmith ou Humanloop jouent ce rôle pour les applications basées sur des LLM via API.
Quels sont les Model Registries open source les plus utilisés ?
MLflow Model Registry est le plus répandu grâce à son intégration avec l'écosystème MLflow. DVC (Data Version Control) offre une approche basée sur Git. Weights & Biases propose un registry intégré à sa plateforme d'expérimentation. Pour les modèles de langage spécifiquement, Hugging Face Hub fait office de registry communautaire avec plus de 500 000 modèles référencés.

Voir aussi

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.