Créateur de Compétences

Score de confiance 84/100

Créez, améliorez et évaluez des compétences d'agent avec un flux guidé : capture de l'intention, rédaction de SKILL.md, exécution d'évaluations et de benchmarks, et optimisation de la description de déclenchement.

déclencheurs:create skillwrite SKILL.mdrun evalsbenchmark skilloptimize descriptionskill creator

GitHub SKILL.md

Ce que cela fait

Un flux complet d'auteur et d'évaluation pour les compétences d'agent. Guide l'auteur à travers l'entretien de l'utilisateur, la rédaction du contenu de SKILL.md, la création de cas de test, l'exécution d'évaluations avec compétence et de base, la notation des résultats et la production d'un rapport de réviseur et d'un benchmark. Inclut également des outils pour itérer sur les descriptions afin d'améliorer la précision du déclenchement.

Quand l'utiliser

Utilisez cette compétence lorsque vous devez créer une nouvelle compétence d'agent à partir d'une conversation utilisateur, améliorer un SKILL.md existant, exécuter des évaluations et des benchmarks reproductibles, ou optimiser le frontmatter et les déclencheurs d'une compétence pour une meilleure activation. Utile lorsque vous voulez des cas de test structurés, une notation reproductible et un réviseur HTML pour le retour humain.

Ce qui est inclus

Scripts : oui (scripts d'évaluation/visionneur et d'empaquetage présents)
Références : oui (schémas et conventions de notation, d'analyse et de comparaison)
Instructions : guide étape par étape pour capturer l'intention, écrire SKILL.md, lancer des cycles d'évaluation (avec compétence et base), rédiger des assertions, noter, agréger des benchmarks et lancer un réviseur statique. Couvre également l'optimisation des descriptions et l'empaquetage.

Agents compatibles

Idéal pour les agents supportant les sous-agents et l'exécution de scripts (Claude Code, agents capables de CLI, environnements pouvant exécuter Python).

Étiquettes

#skill-authoring #evaluation #benchmarking #description-optimization #agent-workflow #testing #automation #docs

Scripts exécutés dans un bac à sableExécution réussieAudité le May 5, 2026

Résumé de l'audit

Comprehensive skill-creator workflow for building, evaluating, and iterating on agent skills. Includes eval framework with A/B testing, description optimization loop, and HTML report generation. Scripts are well-structured but most fail outside the repo context due to module path assumptions (from scripts.X import Y) and missing anthropic dependency. Only utils.py runs standalone cleanly.

Points d'attention

Scripts use 'from scripts.X' imports — must run from repo root
Requires anthropic Python SDK for description optimization
Requires claude CLI for run_eval.py trigger testing
YAML frontmatter parser is simple — may break on complex multiline descriptions

Dépendances manquantes

anthropic

Notes

Well-designed skill with clear progressive disclosure. SKILL.md is thorough with good instructions for both creating and improving skills. The eval/benchmark infrastructure is sophisticated. Main issue is scripts not designed to run independently — they assume repo-root execution context.

Informations

Dépôt: claude-superskills
Étoiles: 23

Score de confiance

Global84

Sécurité93

Qualité du code72

Architecture78

Utilité72

Compétences similaires

Development Worktree

Create an isolated git worktree for feature work, auto-run project setup, and verify a clean test baseline before development.

Readwise Reader Document Management

Manage Readwise Reader documents: list, save, search, move, tag, highlight, export and bulk-edit via official and custom CLIs.

Bounty Hunter — Atlas

Persona skill: 'Atlas' — a profit-focused developer persona for discovering, evaluating and executing paid bounties or freelance tasks with ROI-aware workflows.

Junshi — Research Advisor

Daily strategic research advisor that scans arXiv/venues, digests papers, and proposes bold, ranked research ideas tailored to the user's profile.

Full Stack Builder

End-to-end builder that scaffolds, implements, tests, and optionally deploys web and API applications from a natural-language specification.

ezBookkeeping API Tools

Command-line API tools for ezBookkeeping: record and query transactions, retrieve accounts/categories/tags, and fetch exchange rates for self-hosted personal fi

Feishu Voice Sender

Convert MP3s and send them as native Feishu voice messages (playable voice clips) to users or groups.

Claw Bench

Benchmarking skill that guides an agent through a structured suite of capability tests and reporting steps for leaderboard submission.

Retour aux compétences