
de stella34
Guide la création, le test et l'amélioration itérative des Agent Skills (SKILL.md), y compris l'exécution d'évaluations, la génération de benchmarks et le packaging de bundles de compétences.
La compétence Skill Creator fournit un flux de travail complet pour l'auteur, l'évaluation et l'amélioration des Agent Skills. Elle guide un agent (et les collaborateurs humains) à travers la rédaction des métadonnées SKILL.md, la création de prompts de test et d'évaluations, l'exécution d'évaluations avec compétence et de référence, la notation des sorties, l'agrégation de statistiques de benchmark et la génération d'un visionneur de révision HTML. Elle documente également les boucles de packaging et d'optimisation des descriptions qui aident la compétence à se déclencher correctement dans les systèmes en aval.
Utilisez cette compétence chaque fois que vous ou un membre de l'équipe souhaitez créer une nouvelle compétence, réviser un SKILL.md existant, exécuter des évaluations de cas de test reproductibles ou optimiser le frontmatter d'une compétence pour qu'elle se déclenche plus précisément. Elle est particulièrement précieuse lorsque vous avez besoin de benchmarks quantitatifs ou d'un rapport révisable pour les parties prenantes.
eval-viewer/ et scripts/ pour agréger les benchmarks et packager les compétencesreferences/ et agents/ pour les flux de notation et d'analyseConstruit pour les flux de travail d'auteur avec support de délégation (Claude Code, délégués Cowork) et les agents capables d'exécuter des scripts Python et des CLI.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.