Mettre en place l'observabilité d'une application
Implémentez les trois piliers de l'observabilité (logs, métriques, traces) avec OpenTelemetry, Prometheus et des dashboards Grafana.
Coller dans votre IA
Collez ce prompt dans ChatGPT, Claude ou Gemini et personnalisez les variables entre crochets.
Tu es un expert SRE (Site Reliability Engineering) spécialisé dans l'observabilité des systèmes distribués. Je dois mettre en place les trois piliers de l'observabilité pour mon application. **Application à instrumenter :** - Type : [EX: API Node.js, microservices Python, application Go] - Infrastructure : [EX: Kubernetes, Docker Compose, VPS simple] - Volume de trafic : [EX: 10k requêtes/minute] - Stack actuelle : [EX: aucun monitoring, Sentry uniquement, logs basiques] **Outils disponibles ou souhaités :** - Logs : [EX: Loki + Grafana, ELK Stack, Datadog] - Métriques : [EX: Prometheus + Grafana, CloudWatch, Datadog] - Traces : [EX: Jaeger, Zipkin, Tempo, Datadog APM] Mets en place les trois piliers de l'observabilité : 1. **Logging structuré** : implémente le logging JSON avec des champs standards (timestamp, level, service, trace_id, user_id, duration). Définis les niveaux de log et quand utiliser chacun. Évite les logs inutiles qui noient les logs importants. 2. **Métriques Prometheus** : instrumente les métriques métier clés (taux de succès des commandes, revenus par heure) et techniques (latence P95/P99, taux d'erreur, utilisation des ressources). Fournis le code d'instrumentation. 3. **Tracing distribué avec OpenTelemetry** : configure le SDK OpenTelemetry, instrumente les routes HTTP et les appels de base de données, propage le trace context entre services. 4. **Dashboards Grafana** : propose la définition JSON de 3 dashboards : vue d'ensemble de santé, latence et erreurs, et métriques métier. 5. **Alertes** : définis des règles d'alerte pertinentes avec des seuils basés sur les SLOs (Service Level Objectives) et le budget d'erreur.
Pourquoi ce prompt fonctionne
<p>Ce prompt structure l'observabilité selon les trois piliers reconnus par l'industrie (logs, métriques, traces), ce qui garantit une visibilité complète du système : les logs pour le contexte des erreurs, les métriques pour les tendances et alertes, et les traces pour comprendre les interactions entre services.</p><p>La distinction entre métriques techniques et métriques métier est fondamentale pour les équipes produit : savoir que la latence P99 est de 500ms est utile pour l'ingénierie, mais savoir que le taux de succès des commandes a chuté de 5% est une information critique pour le business. Les deux types de métriques doivent coexister.</p><p>L'adoption d'OpenTelemetry pour le tracing est un choix stratégique judicieux car c'est le standard open-source qui évite le vendor lock-in : le même code d'instrumentation peut envoyer les traces vers Jaeger, Tempo ou Datadog selon les besoins, sans modifier le code applicatif.</p>
Cas d'usage
Résultat attendu
Configuration complète des trois piliers avec code d'instrumentation, dashboards Grafana et règles d'alerte basées sur les SLOs.
Formez-vous en profondeur
Découvrez le skill complet sur Prompt Guide pour maîtriser cette technique de A à Z.
Voir sur Prompt GuideTermes du glossaire
📬 Recevez de nouveaux prompts chaque semaine
Rejoignez notre newsletter et ne manquez aucun prompt.
Prompts similaires
Définir une stratégie Git pour une équipe
Définissez une stratégie Git complète adaptée à votre équipe : branching model, conventions, code review et gestion des releases.
Implémenter la Clean Architecture en pratique
Implémentez la Clean Architecture en pratique avec couches, ports et adaptateurs, use cases et tests unitaires sans infrastructure.
Refactoring de code legacy
Refactorisez du code legacy de manière sécurisée et incrémentale en suivant les principes SOLID et les bonnes pratiques modernes.
Implémenter une gestion des erreurs robuste en Node.js
Créez une architecture de gestion des erreurs Node.js professionnelle avec classes d'erreurs custom, middleware centralisé et monitoring.