
MCPBench
par modelscope
Benchmark d'évaluation complet pour les serveurs MCP, axé sur la précision des tâches, la latence et l'utilisation des jetons.
Ce qu'il fait
MCPBench est un cadre d'évaluation conçu pour tester et comparer rigoureusement les performances des serveurs Model Context Protocol (MCP). Il fournit une méthode standardisée pour mesurer la manière dont différents serveurs gèrent des catégories de tâches spécifiques, permettant aux développeurs d'optimiser la précision et l'efficacité.
Outils
En tant que cadre de benchmarking, MCPBench évalue les capacités suivantes des serveurs cibles :
- Évaluation de la recherche web : Teste la précision et la latence pour les tâches de récupération basées sur le web.
- Évaluation des requêtes de base de données : Analyse la capacité à interagir avec des bases de données et à les interroger.
- Évaluation GAIA : Teste les capacités générales d'assistant IA dans des scénarios complexes du monde réel.
Installation
Pour lancer le benchmark, clonez le dépôt et configurez l'environnement :
conda create -n mcpbench python=3.11 -y
conda activate mcpbench
pip install -r requirements.txt
Configurez vos serveurs dans le dossier configs et lancez les scripts d'évaluation (ex: sh evaluation_websearch.sh your_config.json).
Hôtes supportés
- claude
Installation rapide
pip install -r requirements.txtInformations
- Tarification
- free
- Publié
- 4/15/2026
- étoiles
- 0
Catégories
Choisissez votre client IA et suivez les étapes ci-dessous.
Claude Desktop
Refer to MCPBench configs folder for server pool setup.





