Cette compétence définit des normes d'observabilité exploitables pour les services déployés. Elle guide l'instrumentation des métriques (RED/USE), la mise en œuvre du traçage distribué avec OpenTelemetry, l'exposition des tests de liveness/readiness, et la définition des SLI/SLO et des panneaux de tableau de bord. Utilisez-la pour concevoir ou réviser l'observabilité opérationnelle des services dans un environnement de microservices ou de monolithe.
Utilisez cette compétence lors de la création ou de la révision de l'instrumentation d'un service, de la construction de tableaux de bord ou de la définition des SLO. Elle est appropriée lors de la conception, de la revue de code et dans les runbooks d'astreinte pour garantir que les métriques, les traces et les tests de santé sont implémentés de manière cohérente.
Idéalement utilisée par des agents dotés de capacités de revue de code et de DevOps (agents pouvant lire les fichiers de dépôt et suggérer l'instrumentation), et ceux pouvant exécuter ou suggérer des configurations OpenTelemetry/prometheus/Grafana.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.