When was Claude Opus 4.8 released?

Claude Opus 4.8 was released by Anthropic on May 28 2026.

When was Gemini 3.5 Flash released?

Gemini 3.5 Flash was released by Google on May 19 2026.

Which is better at coding, Claude Opus 4.8 or Gemini 3.5 Flash?

Claude Opus 4.8 leads on SWE-Bench Pro — Claude Opus 4.8 69.2% vs Gemini 3.5 Flash 55.1%.

Which scores higher on Humanity's Last Exam, Claude Opus 4.8 or Gemini 3.5 Flash?

Claude Opus 4.8 leads on Humanity's Last Exam · no tools — Claude Opus 4.8 49.8% vs Gemini 3.5 Flash 40.2%.

Claude Opus 4.8 vs Gemini 3.5 Flash

	Anthropic Claude Opus 4.8	Google Gemini 3.5 Flash
Overview
Company	Anthropic	Google
Release date	May 28 2026	May 19 2026
Access	Proprietary	Proprietary
Specifications
Context window	1M	—
Benchmarks
Nonsense detection BullshitBench v2	95%Best	20%
Agentic coding SWE-Bench Pro	69.2%Best	55.1%
Multilingual coding SWE-Bench Multilingual	84.4%	—
Agentic coding CursorBench v3.1	63.8%Best	49.8%
Agentic coding DeepSWE 1.0	55.8%	—
Next.js coding Next.js Evals	88%	—
Agentic terminal coding Terminal-Bench 2.1	74.6%	76.2%Best
Multi-step tool use MCP Atlas	—	83.6%
General tool use Toolathlon	—	56.5%
Web browsing BrowseComp	84.3%	—
Multidisciplinary reasoning Humanity's Last Exam · no tools	49.8%Best	40.2%
Multidisciplinary reasoning Humanity's Last Exam · with tools	57.9%	—
Abstract reasoning ARC-AGI-2	—	72.1%
Agentic computer use OSWorld-Verified	83.4%Best	78.4%
Agentic financial analysis Finance Agent v2	53.9%	57.9%Best
Agentic legal work Harvey's Legal Agent Benchmark	9.58%	—
Tax questions TaxEval v2	75.63%	—
Medical admin work MedScribe	85.75%	—
Knowledge work GDPval-AA	1890Best	1656
Chart reasoning CharXiv Reasoning	—	84.2%
Multimodal reasoning MMMU-Pro	—	83.6%
Spatial reasoning Blueprint-Bench 2	—	33.6%
Long context MRCR v2 (8-needle) · 128k average	—	77.3%
Long context MRCR v2 (8-needle) · 1M pointwise	—	26.6%
Community preference Arena Elo (Text)	1482Best	1476
Community preference (code) Arena Elo (Code)	1560Best	1500
Timeline
Release gap	Gemini 3.5 Flash shipped 9 days before Claude Opus 4.8

Which is better: Claude Opus 4.8 or Gemini 3.5 Flash?

Claude Opus 4.8 leads Gemini 3.5 Flash on 8 of the 10 benchmarks they both report. Gemini 3.5 Flash shipped 9 days before Claude Opus 4.8, so benchmark comparisons should account for the intervening progress.

Published specifications for these two models are limited — see each model page for the latest details.

On BullshitBench v2, Claude Opus 4.8 leads at 95% vs Gemini 3.5 Flash at 20%. On SWE-Bench Pro, Claude Opus 4.8 leads at 69.2% vs Gemini 3.5 Flash at 55.1%. On CursorBench v3.1, Claude Opus 4.8 leads at 63.8% vs Gemini 3.5 Flash at 49.8%. On Terminal-Bench 2.1, Gemini 3.5 Flash leads at 76.2% vs Claude Opus 4.8 at 74.6%. On Humanity's Last Exam · no tools, Claude Opus 4.8 leads at 49.8% vs Gemini 3.5 Flash at 40.2%. On OSWorld-Verified, Claude Opus 4.8 leads at 83.4% vs Gemini 3.5 Flash at 78.4%. On Finance Agent v2, Gemini 3.5 Flash leads at 57.9% vs Claude Opus 4.8 at 53.9%. On GDPval-AA, Claude Opus 4.8 leads at 1890 vs Gemini 3.5 Flash at 1656. On Arena Elo (Text), Claude Opus 4.8 leads at 1482 vs Gemini 3.5 Flash at 1476. On Arena Elo (Code), Claude Opus 4.8 leads at 1560 vs Gemini 3.5 Flash at 1500.

Frequently asked questions

: Claude Opus 4.8 was released by Anthropic on May 28 2026.
: Gemini 3.5 Flash was released by Google on May 19 2026.
: Claude Opus 4.8 leads on SWE-Bench Pro — Claude Opus 4.8 69.2% vs Gemini 3.5 Flash 55.1%.
: Claude Opus 4.8 leads on Humanity's Last Exam · no tools — Claude Opus 4.8 49.8% vs Gemini 3.5 Flash 40.2%.

Other comparisons

Claude Opus 4.8 vs GPT-5.6 Sol Gemini 3.5 Flash vs GPT-5.6 Sol Claude Opus 4.8 vs Muse Spark 1.1 Gemini 3.5 Flash vs Muse Spark 1.1 Claude Opus 4.8 vs Grok 4.5 Gemini 3.5 Flash vs Grok 4.5 Claude Opus 4.8 vs DeepSeek-V4-Pro Gemini 3.5 Flash vs DeepSeek-V4-Pro Claude Opus 4.8 vs Mistral Medium 3.5 Gemini 3.5 Flash vs Mistral Medium 3.5 Claude Opus 4.8 vs Kimi K2.7 Code Gemini 3.5 Flash vs Kimi K2.7 Code