When was Claude Sonnet 4 released?

Claude Sonnet 4 was released by Anthropic on May 22 2025.

When was GPT-5.1 released?

GPT-5.1 was released by OpenAI on Nov 12 2025.

Which is better on GPQA Diamond, Claude Sonnet 4 or GPT-5.1?

GPT-5.1 scores higher on GPQA Diamond — Claude Sonnet 4 75.4% vs GPT-5.1 88.1%.

Which is better at coding, Claude Sonnet 4 or GPT-5.1?

On SWE-Bench Verified (real-world software-engineering tasks), GPT-5.1 leads — Claude Sonnet 4 scores 72.7% and GPT-5.1 scores 76.3%.

Home Analytics Contact

Latest Release

Muse Spark

Apr 8 2026

Home/Compare/Claude Sonnet 4 vs GPT-5.1

Claude Sonnet 4 vs GPT-5.1

0 vs 3 benchmarks won

	Anthropic Claude Sonnet 4	OpenAI GPT-5.1
Overview
Company	Anthropic	OpenAI
Release date	May 22 2025	Nov 12 2025
Model type	—	—
Open source	No	No
Specifications
Parameters	—	—
Context window	—	—
Benchmarks
Science reasoning GPQA Diamond	75.4%	88.1%
Software engineering SWE-Bench Verified	72.7%	76.3%
Multimodal understanding MMMU	—	76%
Timeline
Release gap	Claude Sonnet 4 shipped 174 days before GPT-5.1

Which is better: Claude Sonnet 4 or GPT-5.1?

GPT-5.1 leads Claude Sonnet 4 on 3 of the tracked benchmarks (GPQA Diamond, SWE-Bench Verified, MMMU). Claude Sonnet 4 shipped 174 days before GPT-5.1, so benchmark comparisons should account for the intervening progress.

Published specifications for these two models are limited — see each model page for the latest details.

On GPQA Diamond, GPT-5.1 scores 88.1%, 12.7 points above Claude Sonnet 4 at 75.4%. On SWE-Bench Verified, GPT-5.1 scores 76.3%, 3.6 points above Claude Sonnet 4 at 72.7%.

Frequently asked questions

When was Claude Sonnet 4 released?: Claude Sonnet 4 was released by Anthropic on May 22 2025.
When was GPT-5.1 released?: GPT-5.1 was released by OpenAI on Nov 12 2025.
Which is better on GPQA Diamond, Claude Sonnet 4 or GPT-5.1?: GPT-5.1 scores higher on GPQA Diamond — Claude Sonnet 4 75.4% vs GPT-5.1 88.1%.
Which is better at coding, Claude Sonnet 4 or GPT-5.1?: On SWE-Bench Verified (real-world software-engineering tasks), GPT-5.1 leads — Claude Sonnet 4 scores 72.7% and GPT-5.1 scores 76.3%.