picksbymodel Get API access →

head-to-head

Qwen: Qwen3.6 Plus vs xAI: Grok 4.20

Side-by-side comparison of specs, pricing, benchmark scores, and task rankings. Updated 2026-06-20.

	Qwen: Qwen3.6 Plus	xAI: Grok 4.20
Vendor	qwen	x-ai
Quality Score	100	100
Benchmark Score	68.1	61.5
Input Price	$0.33/M	$1.25/M
Output Price	$1.95/M	$2.50/M
Context Window	1,000,000	2,000,000
Max Output	65,536	-
Tool Calling	✓	✓
Structured Output	✓	✓
Reasoning Mode	✓	✓
Vision	✓	✓
Audio	-	-
Benchmark Scores
ai_index	65.3	61.0
ai_index_agentic	45.5	-
ai_index_coding	90.0	-
eqbench	-	55.8

Who wins by task?

Task	Qwen: Qwen3.6 Plus	xAI: Grok 4.20
SQL Generation	163	144
Code Review	158	150
Code Completion	132	122
Code Refactoring	157	153
Bug Fixing	168	154
Unit Test Generation	148	135
Code Documentation	140	141
Regex Writing	132	127
CI/CD Pipelines	139	131
Frontend Component Design	141	131
Data Analysis	159	136
CSV / Spreadsheet Cleanup	151	139
ETL Scripting	148	142
JSON Extraction	146	123
Bulk Data Labeling	134	120
OCR / Document Parsing	144	135
Table Extraction from PDFs	144	135
Short-Form Summarization	130	119
Blog Post Writing	135	132

Scores reflect capability match + benchmark data + pricing for each task. Methodology →

Related comparisons

MoonshotAI: Kimi K2.7 Code vs Qwen: Qwen3.6 Plus MoonshotAI: Kimi K2.7 Code vs xAI: Grok 4.20 Qwen: Qwen3.7 Plus vs Qwen: Qwen3.6 Plus Qwen: Qwen3.7 Plus vs xAI: Grok 4.20 MiniMax: MiniMax M3 vs Qwen: Qwen3.6 Plus MiniMax: MiniMax M3 vs xAI: Grok 4.20 StepFun: Step 3.7 Flash vs Qwen: Qwen3.6 Plus StepFun: Step 3.7 Flash vs xAI: Grok 4.20