Classement des modèles IA
Comparez les modèles IA sur les benchmarks agentiques, de raisonnement, de codage et d'utilisation d'outils.
Benchmarks
agentic
reasoning
coding
tool-use
computer-use
HAL
Holistic Agent Leaderboard (Princeton, ICLR 2026). Meta-leaderboard aggregating GAIA, SWE-bench, TAU-bench, CORE-Bench, USACO, and more with cost-performance Pareto analysis. Paused new model updates as of 2026; focusing on reliability.
Agentic0 modèles · % accuracy
Aucun score
Aucun modèle n'a encore été évalué sur ce benchmark.