
de skills1,118
Conseils et configurations pour activer le chevauchement des communications parallèles d'experts dans Megatron-Bridge pour les modèles MoE — utilisez-le pour masquer la latence de dispatch/combine et améliorer le débit.
Fournit des conseils détaillés, des exemples de configurations et des étapes de vérification pour activer le chevauchement (overlap) des communications parallèles d'experts (EP) dans Megatron-Bridge. Décrit les choix de dispatcher (alltoall vs flex), le calcul différé du gradient des poids, les contraintes du backend (DeepEP/HybridEP) et les configurations minimales de fonctionnement pour déployer le chevauchement en toute sécurité.
À utiliser lors de l'exécution de modèles MoE où la communication all-to-all de dispatch/combine des experts est un goulot d'étranglement mesurable et si vous disposez des contraintes de mémoire et de déploiement nécessaires pour optimiser le débit. À éviter pour les exécutions mineures, la mise en place initiale de la correction ou les configurations PyTorch/TE/CUDA incompatibles.
Ingénieurs et agents ayant des connaissances sur l'infrastructure d'entraînement deep-learning (Megatron/Bridge) — utile pour les assistants d'optimisation des performances et les outils d'automatisation d'infrastructure.
NVIDIA Megatron-Bridge expert-parallel overlap tuning skill. No scripts bundled. The SKILL.md body is null and the GitHub source URL returns 404, making the actual content inaccessible. Appears to be a broken or removed skill entry with only metadata (slug, tags, truncated description) available. Cannot verify any guidance content.
Skill content appears to have been removed or the URL is incorrect. The DB entry has metadata but no actual skill body. Recommend re-crawling or marking as broken.
Guide Megatron CI/CD
Guide de référence pour le CI/CD de Megatron-LM : structure du pipeline, libellés de portée des PR, déclenchement du CI interne et étapes d'investigation des échecs CI.
Analyse Vidéo (VA-MCP)
Interrogez les incidents, les alertes, le nombre de capteurs et les métriques d'un backend Elasticsearch VA-MCP (port 9901) pour répondre aux questions sur les infractions, l'occupation et la vitesse.
VSS Video Summarization
Résumez des clips vidéo enregistrés à l'aide d'un microservice de résumé LVS local avec HITL ; basculez vers un VLM lorsque le service est indisponible.