P

Stability AI : Définition et Exemples

Stability AI est une entreprise spécialisée en intelligence artificielle générative, principalement connue pour avoir développé Stable Diffusion, un modèle open source de génération d'images à partir de descriptions textuelles.

Définition complète

Stability AI est une société fondée en 2020 par Emad Mostaque, basée à Londres, qui se positionne comme un acteur majeur de l'IA générative open source. L'entreprise s'est fait connaître mondialement en 2022 avec la sortie de Stable Diffusion, un modèle de diffusion latente capable de générer des images photoréalistes à partir de simples descriptions textuelles (text-to-image).

Contrairement à des concurrents comme DALL-E d'OpenAI ou Midjourney, Stability AI a fait le choix stratégique de l'open source, permettant à quiconque de télécharger, modifier et déployer ses modèles librement. Cette approche a engendré un écosystème florissant d'applications, d'interfaces utilisateur (comme Automatic1111 ou ComfyUI) et de modèles dérivés (fine-tunés) créés par la communauté.

Au-delà de la génération d'images, Stability AI a élargi son portefeuille à d'autres modalités : Stable Audio pour la génération musicale, Stable Video Diffusion pour la vidéo, et des modèles de langage comme StableLM. L'entreprise propose également des API commerciales via sa plateforme DreamStudio pour les utilisateurs et développeurs souhaitant intégrer ces capacités dans leurs produits.

L'histoire de Stability AI est aussi marquée par des controverses, notamment autour des droits d'auteur des données d'entraînement, des difficultés financières et du départ de son fondateur en 2024. Malgré ces défis, les modèles issus de Stability AI restent parmi les plus utilisés dans le domaine de la génération d'images par IA.

Étymologie

Le nom "Stability AI" évoque la notion de stabilité, reflétant l'ambition de l'entreprise de démocratiser l'accès à l'IA de manière stable et durable. Le terme "Stable" dans Stable Diffusion fait référence au processus de diffusion stabilisé utilisé dans l'architecture du modèle, qui transforme progressivement du bruit aléatoire en images cohérentes.

Exemples concrets

Génération d'image avec Stable Diffusion via un prompt détaillé

A majestic castle on a cliff overlooking the ocean at sunset, photorealistic, 8k, cinematic lighting, detailed architecture

Utilisation de Stable Diffusion pour du concept art en jeu vidéo

Fantasy warrior character design, full body, armor with glowing runes, dark fantasy style, concept art, artstation quality

Génération de musique avec Stable Audio

Ambient electronic music, calm and meditative, soft synthesizers, 120 BPM, 30 seconds

Usage pratique

En prompt engineering, les modèles de Stability AI s'utilisent en formulant des descriptions visuelles précises enrichies de modificateurs de style, de qualité et d'éclairage. La maîtrise des prompts négatifs (negative prompts) et des paramètres comme le CFG scale et le nombre d'étapes de diffusion est essentielle pour obtenir des résultats optimaux. L'écosystème open source permet également d'utiliser des techniques avancées comme ControlNet, LoRA et l'inpainting pour un contrôle créatif encore plus fin.

Concepts liés

Diffusion latenteText-to-ImageIA générativeOpen Source AI

FAQ

Quelle est la différence entre Stability AI et Stable Diffusion ?
Stability AI est l'entreprise qui a développé et financé Stable Diffusion. Stable Diffusion est le modèle d'IA lui-même, c'est-à-dire le logiciel de génération d'images. En d'autres termes, Stability AI est le créateur et Stable Diffusion est le produit phare.
Stable Diffusion est-il vraiment gratuit ?
Oui, les modèles Stable Diffusion sont disponibles en open source et peuvent être téléchargés et utilisés gratuitement sur votre propre matériel. Cependant, Stability AI propose aussi DreamStudio, une plateforme en ligne payante qui permet d'utiliser les modèles sans installation locale. De nombreuses interfaces communautaires gratuites existent également.
Quels sont les principaux concurrents de Stability AI ?
Les principaux concurrents sont Midjourney (connu pour sa qualité artistique), DALL-E d'OpenAI (intégré à ChatGPT), Adobe Firefly (axé sur l'usage commercial avec des données d'entraînement sous licence), et Flux de Black Forest Labs (créé par d'anciens chercheurs de Stability AI). Chacun se distingue par son approche, sa qualité de rendu et sa politique d'utilisation.

Voir aussi

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.