
Corral
par lamalab-org
Cadre de benchmarking d'agents scientifiques pour évaluer les performances de l'IA sur les tâches de science des matériaux.
Ce qu'il fait
Corral est un cadre de benchmarking complet spécifiquement conçu pour les agents d'IA effectuant des recherches scientifiques. Il fournit des environnements et des métriques standardisés pour évaluer la manière dont les agents gèrent les défis complexes de la science des matériaux et des mathématiques.
Outils
- Environnements de tâches : Serveurs spécialisés pour les mathématiques, la spectroscopie et la dynamique moléculaire.
- Métriques d'évaluation : Notation automatisée pour pass@k et les taux de réussite.
- Système de points de contrôle : Gestion de l'état pour reprendre les exécutions de benchmarks interrompues.
- Intégration MCP : Capacité de convertir des outils scientifiques au format MCP pour l'utilisation client.
Installation
{
"mcpServers": {
"corral": {
"command": "python3",
"args": ["-m", "corral.server"]
}
}
}
Hôtes supportés
- Claude Desktop
Installation rapide
pip install corralInformations
- Tarification
- free
- Publié
- 5/18/2026
- étoiles






