When was Claude 3.5 Sonnet released?

Claude 3.5 Sonnet was released by Anthropic on Jun 20 2024.

When was GPT-5.1 released?

GPT-5.1 was released by OpenAI on Nov 12 2025.

Which is better on GPQA Diamond, Claude 3.5 Sonnet or GPT-5.1?

GPT-5.1 scores higher on GPQA Diamond — Claude 3.5 Sonnet 59.4% vs GPT-5.1 88.1%.

Which is better at coding, Claude 3.5 Sonnet or GPT-5.1?

On SWE-Bench Verified (real-world software-engineering tasks), GPT-5.1 leads — Claude 3.5 Sonnet scores 33.4% and GPT-5.1 scores 76.3%.

Home Analytics Contact

Latest Release

Muse Spark

Apr 8 2026

Home/Compare/Claude 3.5 Sonnet vs GPT-5.1

Claude 3.5 Sonnet vs GPT-5.1

0 vs 3 benchmarks won

	Anthropic Claude 3.5 Sonnet	OpenAI GPT-5.1
Overview
Company	Anthropic	OpenAI
Release date	Jun 20 2024	Nov 12 2025
Model type	—	—
Open source	No	No
Specifications
Parameters	—	—
Context window	—	—
Benchmarks
Science reasoning GPQA Diamond	59.4%	88.1%
Software engineering SWE-Bench Verified	33.4%	76.3%
Multimodal understanding MMMU	—	76%
Timeline
Release gap	Claude 3.5 Sonnet shipped 510 days before GPT-5.1

Which is better: Claude 3.5 Sonnet or GPT-5.1?

GPT-5.1 leads Claude 3.5 Sonnet on 3 of the tracked benchmarks (GPQA Diamond, SWE-Bench Verified, MMMU). Claude 3.5 Sonnet shipped 510 days before GPT-5.1, so benchmark comparisons should account for the intervening progress.

Published specifications for these two models are limited — see each model page for the latest details.

On GPQA Diamond, GPT-5.1 scores 88.1%, 28.7 points above Claude 3.5 Sonnet at 59.4%. On SWE-Bench Verified, GPT-5.1 scores 76.3%, 42.9 points above Claude 3.5 Sonnet at 33.4%.

Frequently asked questions

When was Claude 3.5 Sonnet released?: Claude 3.5 Sonnet was released by Anthropic on Jun 20 2024.
When was GPT-5.1 released?: GPT-5.1 was released by OpenAI on Nov 12 2025.
Which is better on GPQA Diamond, Claude 3.5 Sonnet or GPT-5.1?: GPT-5.1 scores higher on GPQA Diamond — Claude 3.5 Sonnet 59.4% vs GPT-5.1 88.1%.
Which is better at coding, Claude 3.5 Sonnet or GPT-5.1?: On SWE-Bench Verified (real-world software-engineering tasks), GPT-5.1 leads — Claude 3.5 Sonnet scores 33.4% and GPT-5.1 scores 76.3%.