AI Model Leaderboard

Compare AI models across agentic, reasoning, coding, and tool-use benchmarks.

Agentic Reasoning Coding Tool Use Computer Use

Benchmarks

agentic

reasoning

coding

tool-use

computer-use

USACO

USA Computing Olympiad problems — competitive programming benchmark covering bronze through platinum difficulty. Tests algorithmic reasoning and implementation across increasing difficulty levels.

Coding3 models · % solved

Claude Opus 4.6Undisclosed

51.50% solved