Compétences d'agent

Packages SKILL.md qui étendent Claude Code, Cursor, Copilot et autres agents IA.

Score de confiance Utilité Recommandé Étoiles Récent

Filtres

Étiquettes

OSMO CLI Agent

osmo

Gérez le calcul cloud OSMO : vérifiez les pools, les GPU, les quotas, soumettez et surveillez les flux de travail, inspectez les logs et créez des applications via l'OSMO CLI.

cloudworkflowsgpu

143

7 déclencheurs

ROCm Triton Kernels (RMSNorm, RoPE 3D, GEGLU, AdaLN)

kernels

Conseils et exemples pour l'écriture, le benchmarking et l'intégration de kernels Triton optimisés sur ROCm (MI355X, R9700) pour les charges de travail diffusers et transformers.

gpurocmtriton

599

7 déclencheurs

cuEquivariance Torch (cuet)

cuequivariance

Primitives et couches de tenseurs équivariants accélérées par GPU PyTorch (SegmentedPolynomial, produits tensoriels, harmoniques sphériques, couches linéaires équivariantes) pour la construction de modèles.

pytorchequivariancegpu

388

6 déclencheurs

Terradev — Provisionnement GPU Cross-Cloud

Terradev

Provisionnez et gérez des GPU sur plusieurs clouds, créez des clusters GPU Kubernetes, déployez des points de terminaison d'inférence et basculez le calcul local vers le cloud avec une gestion sécurisée des identifiants BYOAPI.

gpuprovisioningkubernetes

6 déclencheurs

SparkJS - Rendu 3D Gaussian Splat

sparkjs-skill

Outils et conseils pour construire, éditer et optimiser des scènes de Gaussian splat 3D dans le navigateur à l'aide de SparkJS et Three.js.

threejswebglrendering

6 déclencheurs

Entraînement de Modèles CV

cv-train-stack

Réviser, exécuter, valider et auditer l'entraînement de modèles de vision par ordinateur avec des vérifications de la qualité du jeu de données, de la cohérence du prétraitement, de l'augmentation et de la validation du déploiement

computer-visionmodel-trainingdataset-audit

7 déclencheurs

vLLM-Omni Video Generation

vllm-omni-skills

Générez des vidéos (texte→vidéo, image→vidéo, texte+image→vidéo) via vLLM-Omni et des modèles de diffusion de style Wan2.2, avec des conseils sur les paramètres et les compromis de performance

video-generationtext-to-videoimage-to-video

5 déclencheurs

Analyse de Performance MaxText

maxtext-slurm

Un flux d'analyse post-entraînement utilisant le marquage TGS, TraceLens et IRLens pour diagnostiquer les performances d'entraînement des modèles, l'utilisation des GPU et les points chauds au niveau du kernel.

performanceprofilingtracing

6 déclencheurs

Run LLMs Locally (Harbor)

harbor

Déployez, configurez et dépannez une pile LLM locale complète (Ollama, llama.cpp, vLLM, Open WebUI, SearXNG, Open Terminal) à l'aide de la boîte à outils Harbor.

llmlocal-aidocker

2,955

7 déclencheurs

Sub-Agents (Orchestration d'agents parallèles)

modal-auto-research-skills

Orchestrez plusieurs agents Claude Code autonomes sur des GPU ou des sandboxes séparés pour exécuter des expériences parallèles, des sessions de débogage ou des charges de travail par lots avec st

orchestrationagentsdistributed

7 déclencheurs

Appel au modèle NVIDIA NIM

openclaw-nim-skill

Appelez des LLM hébergés par NVIDIA NIM depuis OpenClaw pour décharger les tâches lourdes et économiser les jetons de l'agent principal.

nvidianimllm

7 déclencheurs

Patterns Python HPC

claude-skill-registry

Guide et patterns pour le parallélisme Python et les performances GPU/CPU : threading vs multiprocessing vs asyncio, flux CUDA, PyTorch DDP et benchmarking.

pythonhpcgpu

466

7 déclencheurs

MoE Expert-Parallel Overlap (Megatron-Bridge)

skills

Conseils et configurations pour activer le chevauchement des communications parallèles d'experts dans Megatron-Bridge pour les modèles MoE — utilisez-le pour masquer la latence de dispatch/combine et améliorer le débit.

moemegatronperformance

1,118

8 déclencheurs

MoE Expert-Parallel Overlap

megatron-bridge

Guide l'activation et la validation du chevauchement de communication expert-parallel MoE dans Megatron-Bridge pour masquer la latence de dispatch/combine et améliorer le débit.

moeperformancegpu

637

6 déclencheurs

dbg — CLI de Débogage et de Profilage

dbg

CLI persistante pour le débogage, le profilage et le désassemblage JIT à travers divers langages et backends ; capture les hits pour l'analyse différentielle et les tendances.

debuggingprofilingcli

11 déclencheurs

AKO4ALL — Agentic Kernel Optimization

ako4all

Boucle automatisée qui profile, itère, analyse les performances et commit des optimisations de kernels GPU sur CUDA/Triton/TileLang/Python/C++ pour obtenir des gains de vitesse mesurables.

gpuperformancebenchmarking

262

7 déclencheurs

Litmus — Recherche ML Parallèle

litmus

Orchestre des agents de recherche ML autonomes et parallèles avec des branches d'expérimentation basées sur git, une couche de direction/synthèse et des conclusions synthétisées quotidiennement.

mlresearchautonomous-agents

5 déclencheurs

MotionGPU Core & Adaptateurs

motion-core

Construit et édite du code MotionGPU à travers le cœur et les adaptateurs Svelte/React/Vue.

webgpuwgslreact

9 déclencheurs