Packages SKILL.md qui étendent Claude Code, Cursor, Copilot et autres agents IA.
Étiquettes

osmo
Gérez le calcul cloud OSMO : vérifiez les pools, les GPU, les quotas, soumettez et surveillez les flux de travail, inspectez les logs et créez des applications via l'OSMO CLI.

kernels
Conseils et exemples pour l'écriture, le benchmarking et l'intégration de kernels Triton optimisés sur ROCm (MI355X, R9700) pour les charges de travail diffusers et transformers.

cuequivariance
Primitives et couches de tenseurs équivariants accélérées par GPU PyTorch (SegmentedPolynomial, produits tensoriels, harmoniques sphériques, couches linéaires équivariantes) pour la construction de modèles.

Terradev
Provisionnez et gérez des GPU sur plusieurs clouds, créez des clusters GPU Kubernetes, déployez des points de terminaison d'inférence et basculez le calcul local vers le cloud avec une gestion sécurisée des identifiants BYOAPI.

sparkjs-skill
Outils et conseils pour construire, éditer et optimiser des scènes de Gaussian splat 3D dans le navigateur à l'aide de SparkJS et Three.js.

vllm-omni-skills
Générez des vidéos (texte→vidéo, image→vidéo, texte+image→vidéo) via vLLM-Omni et des modèles de diffusion de style Wan2.2, avec des conseils sur les paramètres et les compromis de performance

maxtext-slurm
Un flux d'analyse post-entraînement utilisant le marquage TGS, TraceLens et IRLens pour diagnostiquer les performances d'entraînement des modèles, l'utilisation des GPU et les points chauds au niveau du kernel.

modal-auto-research-skills
Orchestrez plusieurs agents Claude Code autonomes sur des GPU ou des sandboxes séparés pour exécuter des expériences parallèles, des sessions de débogage ou des charges de travail par lots avec st

skills
Conseils et configurations pour activer le chevauchement des communications parallèles d'experts dans Megatron-Bridge pour les modèles MoE — utilisez-le pour masquer la latence de dispatch/combine et améliorer le débit.

cv-train-stack
Réviser, exécuter, valider et auditer l'entraînement de modèles de vision par ordinateur avec des vérifications de la qualité du jeu de données, de la cohérence du prétraitement, de l'augmentation et de la validation du déploiement

openclaw-nim-skill
Appelez des LLM hébergés par NVIDIA NIM depuis OpenClaw pour décharger les tâches lourdes et économiser les jetons de l'agent principal.

megatron-bridge
Guide l'activation et la validation du chevauchement de communication expert-parallel MoE dans Megatron-Bridge pour masquer la latence de dispatch/combine et améliorer le débit.

claude-skill-registry
Guide et patterns pour le parallélisme Python et les performances GPU/CPU : threading vs multiprocessing vs asyncio, flux CUDA, PyTorch DDP et benchmarking.

harbor
Déployez, configurez et dépannez une pile LLM locale complète (Ollama, llama.cpp, vLLM, Open WebUI, SearXNG, Open Terminal) à l'aide de la boîte à outils Harbor.