
de grind-lab-core88
Surveille les expériences en cours, classifie les statuts (OK/STALLED/FAILED/COMPLETE) et ajoute des alertes aux notes du projet.
Une compétence de surveillance pour les expériences spatiales/ML qui analyse les journaux d'expériences et les fichiers de sortie pour détecter les blocages, les échecs et l'achèvement. Elle définit un flux de travail phasé :
À utiliser quand : vous avez besoin d'un surveillant automatisé pour des expériences de longue durée (exécution périodique, ex: toutes les 15 minutes) pour éviter le gaspillage de ressources de calcul et signaler les problèmes rapidement.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.