head-to-head

StepFun: Step 3.7 Flash vs xAI: Grok Build 0.1

Side-by-side comparison of specs, pricing, benchmark scores, and task rankings. Updated 2026-07-27.

Who wins by task?

Task	StepFun: Step 3.7 Flash	xAI: Grok Build 0.1
SQL Generation	153	130
Code Review	146	126
Code Completion	130	116
Code Refactoring	144	127
Bug Fixing	155	130
Unit Test Generation	139	121
Code Documentation	133	125
Regex Writing	129	119
CI/CD Pipelines	131	117
Frontend Component Design	136	122
Data Analysis	150	124
CSV / Spreadsheet Cleanup	141	127
ETL Scripting	137	122
JSON Extraction	142	123
Bulk Data Labeling	133	121
OCR / Document Parsing	138	128
Table Extraction from PDFs	138	128
Long-Document Summarization	142	129
Short-Form Summarization	128	115
Blog Post Writing	129	118

Scores reflect capability match + benchmark data + pricing for each task. Methodology →