Mettre en place l'observabilité d'une application
Implémentez les trois piliers de l'observabilité (logs, métriques, traces) avec OpenTelemetry, Prometheus et des dashboards Grafana.
Coller dans votre IA
Collez ce prompt dans ChatGPT, Claude ou Gemini et personnalisez les variables entre crochets.
Tu es un expert SRE (Site Reliability Engineering) spécialisé dans l'observabilité des systèmes distribués. Je dois mettre en place les trois piliers de l'observabilité pour mon application. **Application à instrumenter :** - Type : [EX: API Node.js, microservices Python, application Go] - Infrastructure : [EX: Kubernetes, Docker Compose, VPS simple] - Volume de trafic : [EX: 10k requêtes/minute] - Stack actuelle : [EX: aucun monitoring, Sentry uniquement, logs basiques] **Outils disponibles ou souhaités :** - Logs : [EX: Loki + Grafana, ELK Stack, Datadog] - Métriques : [EX: Prometheus + Grafana, CloudWatch, Datadog] - Traces : [EX: Jaeger, Zipkin, Tempo, Datadog APM] Mets en place les trois piliers de l'observabilité : 1. **Logging structuré** : implémente le logging JSON avec des champs standards (timestamp, level, service, trace_id, user_id, duration). Définis les niveaux de log et quand utiliser chacun. Évite les logs inutiles qui noient les logs importants. 2. **Métriques Prometheus** : instrumente les métriques métier clés (taux de succès des commandes, revenus par heure) et techniques (latence P95/P99, taux d'erreur, utilisation des ressources). Fournis le code d'instrumentation. 3. **Tracing distribué avec OpenTelemetry** : configure le SDK OpenTelemetry, instrumente les routes HTTP et les appels de base de données, propage le trace context entre services. 4. **Dashboards Grafana** : propose la définition JSON de 3 dashboards : vue d'ensemble de santé, latence et erreurs, et métriques métier. 5. **Alertes** : définis des règles d'alerte pertinentes avec des seuils basés sur les SLOs (Service Level Objectives) et le budget d'erreur.
Pourquoi ce prompt fonctionne
<p>Ce prompt structure l'observabilité selon les trois piliers reconnus par l'industrie (logs, métriques, traces), ce qui garantit une visibilité complète du système : les logs pour le contexte des erreurs, les métriques pour les tendances et alertes, et les traces pour comprendre les interactions entre services.</p><p>La distinction entre métriques techniques et métriques métier est fondamentale pour les équipes produit : savoir que la latence P99 est de 500ms est utile pour l'ingénierie, mais savoir que le taux de succès des commandes a chuté de 5% est une information critique pour le business. Les deux types de métriques doivent coexister.</p><p>L'adoption d'OpenTelemetry pour le tracing est un choix stratégique judicieux car c'est le standard open-source qui évite le vendor lock-in : le même code d'instrumentation peut envoyer les traces vers Jaeger, Tempo ou Datadog selon les besoins, sans modifier le code applicatif.</p>
Cas d'usage
Résultat attendu
Configuration complète des trois piliers avec code d'instrumentation, dashboards Grafana et règles d'alerte basées sur les SLOs.
Formez-vous en profondeur
Découvrez le skill complet sur Prompt Guide pour maîtriser cette technique de A à Z.
Voir sur Prompt GuideTermes du glossaire
Prompts similaires
Implémenter une gestion des erreurs robuste en Node.js
Créez une architecture de gestion des erreurs Node.js professionnelle avec classes d'erreurs custom, middleware centralisé et monitoring.
Apprendre les bases de Git pour débutants
Apprenez Git de zéro avec des explications imagées, des exemples concrets, un workflow pratique et un cheatsheet des commandes essentielles.
Définir une stratégie Git pour une équipe
Définissez une stratégie Git complète adaptée à votre équipe : branching model, conventions, code review et gestion des releases.
Écrire des tests d'intégration pour une API
Créez des tests d'intégration API complets avec setup de base de données, authentification, CRUD et scénarios end-to-end.