P

MLOps : Définition et Exemples

Le MLOps (Machine Learning Operations) désigne l'ensemble des pratiques, outils et méthodologies qui permettent de déployer, surveiller et maintenir des modèles de machine learning en production de manière fiable et reproductible.

Définition complète

Le MLOps est une discipline qui se situe à l'intersection du machine learning, de l'ingénierie logicielle et des opérations IT (DevOps). Son objectif principal est de combler le fossé entre la phase expérimentale d'un modèle d'IA — développé par des data scientists — et sa mise en production dans un environnement réel, où il doit fonctionner de manière stable, performante et maintenable.

Concrètement, le MLOps couvre l'ensemble du cycle de vie d'un modèle : la gestion des données d'entraînement, le versionnement des modèles et des datasets, l'automatisation des pipelines d'entraînement (CI/CD pour le ML), le déploiement continu, ainsi que le monitoring des performances en production. Sans MLOps, les entreprises font face au problème bien connu du "modèle qui fonctionne en notebook mais jamais en production".

L'une des spécificités du MLOps par rapport au DevOps classique est la gestion du "data drift" et du "model drift" : les données du monde réel évoluent dans le temps, ce qui peut dégrader les performances d'un modèle sans que le code ait changé. Le MLOps intègre donc des systèmes de surveillance continue qui détectent ces dérives et déclenchent automatiquement un réentraînement si nécessaire.

Dans le contexte de l'IA générative et du prompt engineering, le MLOps s'étend désormais au "LLMOps" : la gestion des pipelines de prompts, le versionnement des templates, l'évaluation systématique des réponses générées, et l'optimisation des coûts d'inférence. Ces pratiques sont essentielles pour toute organisation qui souhaite intégrer l'IA de manière industrielle et responsable.

Étymologie

MLOps est un mot-valise formé de "ML" (Machine Learning) et "Ops" (Operations), calqué sur le terme "DevOps" (Development + Operations) popularisé dans les années 2010. Le terme est apparu vers 2018-2019 dans la communauté data science pour décrire l'application des principes DevOps au cycle de vie des modèles de machine learning.

Exemples concrets

Automatiser le réentraînement d'un modèle de recommandation

Conçois un pipeline MLOps pour un modèle de recommandation e-commerce. Le pipeline doit inclure : ingestion quotidienne des nouvelles données utilisateur, réentraînement hebdomadaire automatisé, tests A/B entre l'ancien et le nouveau modèle, et rollback automatique si les métriques de conversion baissent de plus de 5%.

Mettre en place un monitoring de drift pour un modèle de scoring crédit

Propose une stratégie de monitoring MLOps pour détecter le data drift sur un modèle de scoring crédit en production. Quelles métriques statistiques surveiller sur les features d'entrée ? Quels seuils d'alerte configurer ? Comment automatiser le réentraînement en cas de drift significatif ?

Choisir une stack MLOps adaptée à une startup

Je suis CTO d'une startup avec 3 data scientists. Nous avons 5 modèles en production sur AWS. Compare les options MLOps suivantes pour notre contexte : MLflow + SageMaker vs Weights & Biases + Kubeflow vs solution full managed (Vertex AI). Critères : coût, courbe d'apprentissage, scalabilité.

Usage pratique

En prompt engineering, les principes MLOps s'appliquent à la gestion industrielle des prompts : versionner ses templates, évaluer systématiquement les outputs avec des métriques définies, et monitorer les coûts et la qualité des réponses en production. Utiliser un prompt pour demander à une IA de concevoir une architecture MLOps permet d'obtenir des résultats plus pertinents en précisant le contexte technique (cloud provider, taille de l'équipe, volume de données) et les contraintes métier (latence, conformité réglementaire).

Concepts liés

DevOpsPipeline de donnéesModel driftCI/CD pour le machine learning

FAQ

Quelle est la différence entre MLOps et DevOps ?
Le DevOps gère le cycle de vie du code logiciel (build, test, deploy), tandis que le MLOps gère en plus le cycle de vie des données et des modèles. En MLOps, il faut versionner non seulement le code mais aussi les datasets, les hyperparamètres et les artefacts de modèles. De plus, le MLOps doit gérer des problématiques absentes du DevOps classique, comme le data drift ou la reproductibilité des expériences.
Quels sont les outils MLOps les plus utilisés en 2025 ?
Les outils MLOps les plus populaires incluent MLflow (tracking d'expériences et registre de modèles), Kubeflow (orchestration sur Kubernetes), Weights & Biases (suivi d'expériences), DVC (versionnement de données), et les solutions cloud managées comme AWS SageMaker, Google Vertex AI et Azure ML. Pour le LLMOps spécifiquement, des outils comme LangSmith, Promptfoo et Humanloop se sont imposés.
Faut-il du MLOps pour utiliser des LLM via API ?
Oui, même en utilisant des LLM via API (sans entraîner de modèle), les principes MLOps restent essentiels. On parle alors de LLMOps : il faut versionner les prompts, monitorer la qualité et la latence des réponses, gérer les coûts d'inférence, mettre en place des garde-fous (guardrails), et évaluer régulièrement les performances face aux mises à jour des modèles par les fournisseurs.

Voir aussi

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.