Retour aux applications

AgentEvals
Interface UIpar agentevals-dev
Évaluation d'agents IA indépendante du framework utilisant les traces OpenTelemetry pour noter la performance et la qualité de l'inférence sans réexécution.
0 étoiles
Fonctionne dans:claude
Expose:Tools
Ce qu'il fait
AgentEvals se connecte aux traces d'exécution des agents IA via OpenTelemetry (OTel) pour fournir une notation déterministe du comportement de l'agent. Il permet aux développeurs de benchmarker les agents avant la production en analysant les trajectoires d'outils et la qualité des réponses à partir des traces existantes, éliminant ainsi le besoin de ré-exécutions coûteuses et lentes.
Outils
list_metrics: Affiche toutes les métriques d'évaluation intégrées et communautaires disponibles.evaluate_traces: Traite les fichiers de traces OTLP ou Jaeger locaux pour générer des scores.list_sessions: Liste les sessions de streaming actives pour une évaluation en temps réel.summarize_session: Fournit un résumé structuré des appels d'outils d'une session d'agent.evaluate_sessions: Note les sessions en direct par rapport à un ensemble de référence doré défini.
Installation
Ajoutez à votre claude_desktop_config.json :
{
"mcpServers": {
"agentevals": {
"command": "agentevals",
"args": ["mcp"]
}
}
}
Hôtes supportés
- Claude Desktop
- Claude Code
Installation rapide
pip install agentevals-cliInformations
- Tarification
- free
- Publié
- 6/18/2026
- étoiles
- 0
Catégories
Choisissez votre client IA et suivez les étapes ci-dessous.
Claude Desktop
{"mcpServers": {"agentevals": {"command": "agentevals", "args": ["mcp"]}}}





