Auto-updated

AI Coding Leaderboard

Rankings by benchmark. Scores sourced from official provider release posts and updated automatically.

Real-world GitHub issues resolved autonomously. The best proxy for agentic coding ability.

#	Model	Provider	Type	SWE-bench Verified
🥇	Claude Fable 5	Anthropic	Closed	95.0%
🥈	Claude Opus 4.8	Anthropic	Closed	88.6%
🥉	Claude Opus 4.7	Anthropic	Closed	87.6%
#4	Claude Sonnet 5	Anthropic	Closed	~85.2%
#5	GPT-5.5	OpenAI	Closed	82.6%
#6	DeepSeek V4	DeepSeek	Open	80.6%
#7	Claude Sonnet 4.6	Anthropic	Closed	79.6%
#8	GPT-5	OpenAI	Closed	74.9%
#9	Claude Haiku 4.5	Anthropic	Closed	73.3%

Scores sourced from official provider release posts. Tilde (~) prefix indicates approximate figures. Rankings update automatically when new benchmark results are published. Data last updated 2026-07-08. View full model specs →

← For Developers Compare any two models →