Packages SKILL.md qui étendent Claude Code, Cursor, Copilot et autres agents IA.
Étiquettes
ai-rig
Exécute des benchmarks synthétiques et des tests de calibration pour les agents et les skills : mesure le rappel, la précision, la calibration de la confiance et les comparaisons A/B pour quantifier les performances.