Llama 3 : Définition et Exemples
Llama 3 est une famille de grands modèles de langage open source développée par Meta (anciennement Facebook), conçue pour rivaliser avec les meilleurs modèles propriétaires tout en restant librement accessible à la communauté.
Définition complète
Llama 3 (Large Language Model Meta AI, 3e génération) est une famille de modèles de langage publiée par Meta en avril 2024. Elle représente un bond significatif par rapport à Llama 2, avec des performances qui rivalisent avec les modèles propriétaires comme GPT-4 et Claude sur de nombreux benchmarks. Llama 3 est disponible en plusieurs tailles — notamment 8B et 70B paramètres — ce qui permet de l'adapter à des cas d'usage variés, du déploiement sur un ordinateur personnel jusqu'aux infrastructures cloud les plus exigeantes.
La philosophie de Meta avec Llama 3 repose sur l'open source : les poids du modèle sont téléchargeables gratuitement, permettant à quiconque de les utiliser, de les fine-tuner ou de les intégrer dans des applications commerciales (sous licence permissive). Cette approche a catalysé un écosystème entier d'outils, d'adaptations et de modèles dérivés créés par la communauté, faisant de Llama 3 l'un des modèles open source les plus adoptés au monde.
Sur le plan technique, Llama 3 s'appuie sur une architecture Transformer optimisée, un tokenizer amélioré (128K tokens de vocabulaire), et un entraînement sur un corpus massif de plus de 15 000 milliards de tokens. Le modèle excelle en raisonnement, en génération de code, en suivi d'instructions et en compréhension multilingue. Meta a également publié Llama 3.1 (avec une version 405B paramètres) puis Llama 3.2 (intégrant des capacités multimodales vision et des versions légères pour l'edge), consolidant Llama 3 comme une plateforme en constante évolution.
Pour les praticiens du prompt engineering, Llama 3 offre l'avantage majeur de pouvoir être exécuté localement ou sur une infrastructure privée, garantissant le contrôle total des données. Son format de prompt structuré (avec des balises de rôle système, utilisateur et assistant) est compatible avec les techniques de prompting avancées comme le few-shot, le chain-of-thought et le RAG.
Étymologie
"Llama" est l'acronyme de Large Language Model Meta AI. Le chiffre 3 désigne la troisième génération majeure de cette famille de modèles. Le nom fait aussi un clin d'œil au lama, l'animal, que Meta utilise comme mascotte informelle du projet.
Exemples concrets
Déploiement local pour un chatbot d'entreprise confidentiel
Tu es un assistant juridique spécialisé en droit du travail français. Réponds de manière précise et cite les articles de loi pertinents. Question : quelles sont les conditions de validité d'une rupture conventionnelle ?
Fine-tuning de Llama 3 pour un domaine spécifique
En utilisant le format Alpaca, génère 50 paires instruction/réponse pour entraîner un modèle spécialisé en diagnostic médical vétérinaire pour les bovins.
Utilisation via une API compatible (Ollama, vLLM, Together AI)
<|begin_of_text|><|start_header_id|>system<|end_header_id|> Tu es un expert en analyse de données Python. Réponds avec du code commenté. <|start_header_id|>user<|end_header_id|> Écris un script qui charge un CSV, détecte les outliers avec l'IQR et génère un rapport visuel.
Usage pratique
En prompt engineering, Llama 3 s'utilise principalement lorsqu'on a besoin de confidentialité des données, de personnalisation poussée via le fine-tuning, ou de maîtrise des coûts d'inférence. On peut le déployer localement avec des outils comme Ollama ou llama.cpp, ou l'utiliser via des fournisseurs cloud compatibles. Les techniques de prompting standard (system prompt, few-shot, chain-of-thought) fonctionnent efficacement, en respectant le format de prompt spécifique à Llama 3 avec ses balises de rôle.
Concepts liés
FAQ
Quelle est la différence entre Llama 3, Llama 3.1 et Llama 3.2 ?
Peut-on utiliser Llama 3 commercialement ?
Comment exécuter Llama 3 sur son propre ordinateur ?
Voir aussi
Recevez de nouveaux prompts chaque semaine
Rejoignez notre newsletter.