
de NVIDIA Skills76
Guide de référence pour le CI/CD de Megatron-LM : structure du pipeline, libellés de portée des PR, déclenchement du CI interne et étapes d'investigation des échecs CI.
Documente les flux de travail CI/CD utilisés par le projet Megatron-LM de NVIDIA. La compétence explique la structure principale du flux de travail GitHub Actions, l'arbre de décision pour les libellés de PR qui contrôlent la portée des tests et le nombre de répétitions, la manière dont les images sont poussées vers les registres, et les commandes pratiques pour déclencher le CI interne et localiser les journaux du pipeline. Elle fournit également des procédures pour enquêter sur les échecs et les corréler aux modifications de la PR.
Utilisez-la pour déboguer des exécutions CI échouées, décider des libellés de PR à attacher pour ouvrir une PR, déclencher des pipelines internes sans accès à l'interface utilisateur, ou comprendre comment les étapes du CI correspondent à la portée des tests et aux images de conteneur. Idéal pour les mainteneurs, les ingénieurs CI et les contributeurs travaillant sur le code d'entraînement de modèles où la sélection de la portée des tests est cruciale.
tools/trigger_internal_ci.py et exemples d'utilisation pour déclencher le CI GitLab interne.gh pour visualiser les métadonnées et les exécutions de PR, et conseils pour localiser et lire les artefacts et journaux CI.Inféré : agents orientés développeurs avec accès shell et capacité CLI GitHub (gh, bash), et agents utilisés par les mainteneurs pour l'automatisation du CI.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.