P
💻DeveloppementAvanceClaude

Mettre en place l'observabilité d'une application

Implémentez les trois piliers de l'observabilité (logs, métriques, traces) avec OpenTelemetry, Prometheus et des dashboards Grafana.

Coller dans votre IA

Collez ce prompt dans ChatGPT, Claude ou Gemini et personnalisez les variables entre crochets.

Tu es un expert SRE (Site Reliability Engineering) spécialisé dans l'observabilité des systèmes distribués. Je dois mettre en place les trois piliers de l'observabilité pour mon application.

**Application à instrumenter :**
- Type : [EX: API Node.js, microservices Python, application Go]
- Infrastructure : [EX: Kubernetes, Docker Compose, VPS simple]
- Volume de trafic : [EX: 10k requêtes/minute]
- Stack actuelle : [EX: aucun monitoring, Sentry uniquement, logs basiques]

**Outils disponibles ou souhaités :**
- Logs : [EX: Loki + Grafana, ELK Stack, Datadog]
- Métriques : [EX: Prometheus + Grafana, CloudWatch, Datadog]
- Traces : [EX: Jaeger, Zipkin, Tempo, Datadog APM]

Mets en place les trois piliers de l'observabilité :

1. **Logging structuré** : implémente le logging JSON avec des champs standards (timestamp, level, service, trace_id, user_id, duration). Définis les niveaux de log et quand utiliser chacun. Évite les logs inutiles qui noient les logs importants.

2. **Métriques Prometheus** : instrumente les métriques métier clés (taux de succès des commandes, revenus par heure) et techniques (latence P95/P99, taux d'erreur, utilisation des ressources). Fournis le code d'instrumentation.

3. **Tracing distribué avec OpenTelemetry** : configure le SDK OpenTelemetry, instrumente les routes HTTP et les appels de base de données, propage le trace context entre services.

4. **Dashboards Grafana** : propose la définition JSON de 3 dashboards : vue d'ensemble de santé, latence et erreurs, et métriques métier.

5. **Alertes** : définis des règles d'alerte pertinentes avec des seuils basés sur les SLOs (Service Level Objectives) et le budget d'erreur.

Pourquoi ce prompt fonctionne

<p>Ce prompt structure l'observabilité selon les trois piliers reconnus par l'industrie (logs, métriques, traces), ce qui garantit une visibilité complète du système : les logs pour le contexte des erreurs, les métriques pour les tendances et alertes, et les traces pour comprendre les interactions entre services.</p><p>La distinction entre métriques techniques et métriques métier est fondamentale pour les équipes produit : savoir que la latence P99 est de 500ms est utile pour l'ingénierie, mais savoir que le taux de succès des commandes a chuté de 5% est une information critique pour le business. Les deux types de métriques doivent coexister.</p><p>L'adoption d'OpenTelemetry pour le tracing est un choix stratégique judicieux car c'est le standard open-source qui évite le vendor lock-in : le même code d'instrumentation peut envoyer les traces vers Jaeger, Tempo ou Datadog selon les besoins, sans modifier le code applicatif.</p>

Cas d'usage

Mise en place du monitoring de productionDébogage d'incidents complexesConformité aux SLOs et SLAs

Résultat attendu

Configuration complète des trois piliers avec code d'instrumentation, dashboards Grafana et règles d'alerte basées sur les SLOs.

Formez-vous en profondeur

Découvrez le skill complet sur Prompt Guide pour maîtriser cette technique de A à Z.

Voir sur Prompt Guide