
de skills1,118
Guide de référence pour le CI/CD de Megatron-LM : structure du pipeline, libellés de portée des PR, déclenchement du CI interne et étapes d'investigation des échecs CI.
Documente les flux de travail CI/CD utilisés par le projet Megatron-LM de NVIDIA. La compétence explique la structure principale du flux de travail GitHub Actions, l'arbre de décision pour les libellés de PR qui contrôlent la portée des tests et le nombre de répétitions, la manière dont les images sont poussées vers les registres, et les commandes pratiques pour déclencher le CI interne et localiser les journaux du pipeline. Elle fournit également des procédures pour enquêter sur les échecs et les corréler aux modifications de la PR.
Utilisez-la pour déboguer des exécutions CI échouées, décider des libellés de PR à attacher pour ouvrir une PR, déclencher des pipelines internes sans accès à l'interface utilisateur, ou comprendre comment les étapes du CI correspondent à la portée des tests et aux images de conteneur. Idéal pour les mainteneurs, les ingénieurs CI et les contributeurs travaillant sur le code d'entraînement de modèles où la sélection de la portée des tests est cruciale.
tools/trigger_internal_ci.py et exemples d'utilisation pour déclencher le CI GitLab interne.gh pour visualiser les métadonnées et les exécutions de PR, et conseils pour localiser et lire les artefacts et journaux CI.Inféré : agents orientés développeurs avec accès shell et capacité CLI GitHub (gh, bash), et agents utilisés par les mainteneurs pour l'automatisation du CI.
Compétence de guide de référence CI/CD pour NVIDIA Megatron-LM. Le corps du SKILL.md était nul dans la base de données et l'URL source renvoie une 404 — le chemin 'skills/Megatron-Core/cicd/SKILL.md' n'existe pas dans le dépôt nvidia/skills. Aucun script n'a été intégré. Impossible d'auditer le contenu réel ; score basé sur les métadonnées uniquement.
Corps de la compétence indisponible (nul dans la DB, 404 sur GitHub). Le dépôt nvidia/skills ne contient pas le chemin 'skills/Megatron-Core/cicd/SKILL.md'. Envisagez de marquer cette compétence comme cassée/inaccessible ou de la rescanner via le chemin correct.
MoE Expert-Parallel Overlap (Megatron-Bridge)
Conseils et configurations pour activer le chevauchement des communications parallèles d'experts dans Megatron-Bridge pour les modèles MoE — utilisez-le pour masquer la latence de dispatch/combine et améliorer le débit.
Analyse Vidéo (VA-MCP)
Interrogez les incidents, les alertes, le nombre de capteurs et les métriques d'un backend Elasticsearch VA-MCP (port 9901) pour répondre aux questions sur les infractions, l'occupation et la vitesse.
VSS Video Summarization
Résumez des clips vidéo enregistrés à l'aide d'un microservice de résumé LVS local avec HITL ; basculez vers un VLM lorsque le service est indisponible.