Packages SKILL.md qui étendent Claude Code, Cursor, Copilot et autres agents IA.
Étiquettes

kernels
Conseils et exemples pour l'écriture, le benchmarking et l'intégration de kernels Triton optimisés sur ROCm (MI355X, R9700) pour les charges de travail diffusers et transformers.

codescalebench
Lancez, gérez et relancez les suites de benchmarks CodeScaleBench avec des garde-fous de sécurité, l'exécution couplée baseline+full et des utilitaires d'orchestration.

claude-superskills
Créez, améliorez et évaluez des compétences d'agent avec un flux guidé : capture de l'intention, rédaction de SKILL.md, exécution d'évaluations et de benchmarks, et optimisation de la description de déclenchement.

claude-plugins
Cadre d'évaluation et outils pour mesurer systématiquement les performances des LLM à l'aide de métriques automatisées, du jugement humain et de tests A/B.

dotfiles
Guide le profilage et les optimisations ciblées pour le code et les systèmes — mesurez, identifiez les goulots d'étranglement et vérifiez les améliorations sur Python, Node, shell et système

claude-skill-registry
Diagnostiquez les goulots d'étranglement de performance des applications et concevez des optimisations pour le backend, la base de données, la mise en cache et les Core Web Vitals du frontend.

gstack
Mesure et détecte les régressions de performance des pages web à l'aide de benchmarks automatisés, de baselines et d'analyses de tendances.

skillattack
Extrait, importe et ajoute des résultats d'évaluation de modèles structurés aux fiches de modèles Hugging Face ; exécute ou importe des évaluations de benchmark et génère le YAML model-index.

opencode-skills-collection
Profiler et optimiser les applications Python pour réduire la latence et l'utilisation de la mémoire à l'aide de profileurs CPU/mémoire et des meilleures pratiques de performance.

tao
Méthodologie d'audit de performance structurée : mesurer, identifier les goulots d'étranglement, optimiser le point critique et vérifier les améliorations avec des benchmarks.

ai-rig
Exécute des benchmarks synthétiques et des tests de calibration pour les agents et les skills : mesure le rappel, la précision, la calibration de la confiance et les comparaisons A/B pour quantifier les performances.

skill-creator-claw
Créez, testez et améliorez itérativement les compétences OpenClaw ; inclut des flux d'évaluation, des guides de cas de test et des outils d'empaquetage.

ide-agent-kit
API d'arène de puzzles compétitifs pour agents IA : puzzles chronométrés, classements par modèle, création et modération de puzzles.

qec-autoresearch-skills
Guide pour sélectionner des backends de décodeurs de correction d'erreurs quantiques (QEC) basés sur la forme des artefacts, la famille de codes, le modèle de bruit et les objectifs de validation.

sage
Créer, itérer et évaluer des compétences d'agent : rédiger le SKILL.md, concevoir des cas de test, exécuter des benchmarks et améliorer le déclenchement et la performance.

awesome-omni-skill
Flux de travail guidé pour la rédaction, le test et l'itération des Agent Skills : rédaction du SKILL.md, exécution d'évaluations, notation des résultats et optimisation des descriptions pour améliorer la précision du déclenchement.

awesome-copilot
Créer, exécuter et analyser des expériences Arize pour évaluer et comparer les performances des modèles à l'aide de l'interface CLI ax.

arize-skills
Créez, exécutez et analysez des expériences Arize pour évaluer et comparer les performances des modèles via le CLI ax.

claude-skill-registry
Guide et patterns pour le parallélisme Python et les performances GPU/CPU : threading vs multiprocessing vs asyncio, flux CUDA, PyTorch DDP et benchmarking.

ostack-saas
Benchmarking de performance automatisé et détection de régression : capture les lignes de base, mesure les Core Web Vitals et compare les métriques entre les PR pour signaler les régressions.

stella
Guide la création, le test et l'amélioration itérative des Agent Skills (SKILL.md), y compris l'exécution d'évaluations, la génération de benchmarks et le packaging de bundles de compétences.

gstack-ko
Exécutez des lignes de base de performance automatisées et la détection de régressions pour les pages web (TTFB, FCP, LCP, tailles de bundles, requêtes) et comparez-les aux lignes de base historiques.

jiuwenswarm
Pilote l'interface CLI skvm pour profiler des modèles, compiler des compétences AOT, exécuter des tâches uniques et des benchmarks, et gérer les propositions de compilation/jit via des flux CLI sécurisés

civic-analytics-agent-workflow-claude-skill
Un workflow maître pour l'analyse des politiques urbaines et l'innovation civique : cadre les problèmes, effectue des analyses fondées sur des preuves, rédige des communications et établit des benchmarks entre villes.