Compétences d'agent

Packages SKILL.md qui étendent Claude Code, Cursor, Copilot et autres agents IA.

Score de confiance Utilité Recommandé Étoiles Récent

Filtres

Étiquettes

Calibrate — Analyse Comparative d'Agents et de Skills

ai-rig

Exécute des benchmarks synthétiques et des tests de calibration pour les agents et les skills : mesure le rappel, la précision, la calibration de la confiance et les comparaisons A/B pour quantifier les performances.

benchmarkingcalibrationevaluation

5 déclencheurs