head-to-head

Anthropic: Claude Sonnet 5 vs OpenAI: GPT-5.4 Mini

Side-by-side comparison of specs, pricing, benchmark scores, and task rankings. Updated 2026-07-01.

Who wins by task?

Task	Anthropic: Claude Sonnet 5	OpenAI: GPT-5.4 Mini
SQL Generation	132	164
Code Review	132	159
Code Completion	117	132
Code Refactoring	136	158
Bug Fixing	136	170
Unit Test Generation	124	148
Code Documentation	129	140
Regex Writing	117	132
CI/CD Pipelines	120	139
Frontend Component Design	122	141
Data Analysis	124	160
CSV / Spreadsheet Cleanup	132	151
ETL Scripting	128	149
JSON Extraction	121	146
Bulk Data Labeling	118	133
OCR / Document Parsing	131	144
Table Extraction from PDFs	131	144
Long-Document Summarization	136	154
Short-Form Summarization	113	129
Blog Post Writing	120	136

Scores reflect capability match + benchmark data + pricing for each task. Methodology →