Modell	Anbieter	Intelligenz	Coding	Input $/M	Output $/M	Mischpreis $/M	Geschw. t/s	TTFT s	Kontext	Wert ↓
Qwen3.5 4B (Reasoning)	Alibaba	20.1	22.6	$0.03	$0.15	$0.06	29.7	0.47	—	335.0
Gemma 4 E4B (Reasoning)	Google	11.9	9.4	$0.02	$0.10	$0.04	106.6	0.30	—	297.5
HyperNova 60B 2605	Multiverse Computing	17.8	23.2	$0.04	$0.14	$0.07	421.0	0.48	—	273.8
Qwen3.5 4B (Non-reasoning)	Alibaba	16.0	20.3	$0.03	$0.15	$0.06	23.9	0.66	—	266.7
DeepSeek V4 Flash (Reasoning, Max Effort)	DeepSeek	40.3	56.2	$0.14	$0.28	$0.17	117.7	0.86	—	230.3
Gemma 4 E4B (Non-reasoning)	Google	8.9	—	$0.02	$0.10	$0.04	107.4	0.28	—	222.5
DeepSeek V4 Flash (Reasoning, High Effort)	DeepSeek	37.5	52.0	$0.14	$0.28	$0.17	0.0	0.00	—	214.3
MiMo-V2.5	Xiaomi	37.2	56.8	$0.14	$0.28	$0.17	62.6	2.57	—	212.6
MiMo-V2-Flash (Reasoning)	Xiaomi	31.2	—	$0.10	$0.30	$0.15	0.0	0.00	—	208.0
Qwen3.5 9B (Reasoning)	Alibaba	21.4	28.7	$0.10	$0.15	$0.11	50.4	1.22	—	189.4
Step 3.5 Flash 2603	StepFun	26.0	—	$0.10	$0.30	$0.15	297.0	0.75	—	173.3
Step 3.5 Flash	StepFun	25.5	—	$0.10	$0.30	$0.15	0.0	0.00	—	170.0
Hy3-preview (Reasoning)	Tencent	33.6	—	$0.12	$0.43	$0.20	114.8	1.77	—	168.0
Hy3	Tencent	41.2	58.8	$0.14	$0.58	$0.25	65.8	1.81	—	164.8
DeepSeek V4 Flash (Non-reasoning)	DeepSeek	28.7	—	$0.14	$0.28	$0.17	115.2	0.89	—	164.0
NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)	NVIDIA	14.2	14.4	$0.05	$0.20	$0.09	112.0	1.21	—	161.4
Sarvam 105B (high)	Sarvam	11.9	—	$0.04	$0.17	$0.07	0.0	0.00	—	160.8
gpt-oss-20b (high)	OpenAI	14.9	20.7	$0.06	$0.20	$0.10	242.7	0.44	—	156.8
GLM-4.7-Flash (Reasoning)	Z AI	22.9	—	$0.07	$0.40	$0.15	0.0	0.00	—	149.7
Gemma 4 12B (Reasoning)	Google	21.8	31.0	$0.10	$0.30	$0.15	133.5	1.28	—	145.3
GPT-5 nano (high)	OpenAI	19.9	—	$0.05	$0.40	$0.14	0.0	0.00	—	144.2
Sarvam 30B (high)	Sarvam	6.6	—	$0.03	$0.11	$0.05	0.0	0.00	—	140.4
gpt-oss-20b (low)	OpenAI	14.3	—	$0.07	$0.20	$0.10	273.0	0.46	—	138.8
GPT-5 nano (medium)	OpenAI	19.0	—	$0.05	$0.40	$0.14	0.0	0.00	—	137.7
Hy3-preview (Non-reasoning)	Tencent	26.1	—	$0.12	$0.43	$0.20	126.8	1.69	—	130.5
Gemma 4 26B A4B (Reasoning)	Google	25.7	39.3	$0.13	$0.40	$0.20	0.0	0.00	—	129.8
NVIDIA Nemotron Nano 9B V2 (Reasoning)	NVIDIA	8.8	—	$0.04	$0.16	$0.07	82.2	7.66	—	125.7
Nemotron 3 Nano Omni 30B A3B Reasoning	NVIDIA	14.9	13.8	$0.07	$0.30	$0.13	322.7	0.53	—	113.7
Granite 4.1 8B	IBM	6.7	9.5	$0.05	$0.10	$0.06	113.5	0.46	—	106.3
Gemma 4 31B (Non-reasoning)	Google	21.8	33.2	$0.14	$0.40	$0.20	71.3	0.96	—	106.3
DeepSeek V3.2 (Reasoning)	DeepSeek	32.0	44.2	$0.28	$0.42	$0.32	0.0	0.00	—	101.6
Gemma 4 26B A4B (Non-reasoning)	Google	20.1	—	$0.13	$0.40	$0.20	54.4	0.65	—	101.5
GLM-4.7-Flash (Non-reasoning)	Z AI	15.5	—	$0.07	$0.40	$0.15	0.0	0.00	—	101.3
Grok 4 Fast (Reasoning)	SpaceXAI	27.4	—	$0.20	$0.50	$0.28	0.0	0.00	—	99.6
Mistral Small 3.1	Mistral	14.7	26.3	$0.10	$0.30	$0.15	0.0	0.00	—	98.0
Llama 3.1 Instruct 8B	Meta	7.6	5.4	$0.07	$0.09	$0.08	0.0	0.00	—	96.2
Ling 2.6 Flash	InclusionAI	14.1	25.3	$0.10	$0.30	$0.15	155.9	0.67	—	94.0
gpt-oss-120b (high)	OpenAI	23.8	30.4	$0.15	$0.60	$0.26	275.7	0.52	—	90.8
Gemma 4 12B (Non-reasoning)	Google	13.2	—	$0.10	$0.30	$0.15	127.2	1.36	—	88.0
Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)	Google	15.1	—	$0.10	$0.40	$0.17	0.0	0.00	—	86.3
NVIDIA Nemotron Nano 9B V2 (Non-reasoning)	NVIDIA	7.4	—	$0.05	$0.20	$0.09	103.4	2.38	—	86.0
MiniMax-M3	MiniMax	44.4	58.6	$0.30	$1.20	$0.53	86.6	1.19	—	84.6
NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)	NVIDIA	7.4	—	$0.05	$0.20	$0.09	98.5	0.61	—	84.1
GPT-5.4 nano (xhigh)	OpenAI	38.2	56.1	$0.20	$1.25	$0.46	0.0	0.00	—	82.5
DeepSeek V4 Pro (Reasoning, Max Effort)	DeepSeek	44.3	59.4	$0.43	$0.87	$0.54	70.9	1.02	—	81.4
DeepSeek V3.2 Exp (Reasoning)	DeepSeek	25.4	—	$0.28	$0.42	$0.32	0.0	0.00	—	80.6
DeepSeek V4 Pro (Reasoning, High Effort)	DeepSeek	43.1	58.7	$0.43	$0.87	$0.54	72.9	0.92	—	79.2
DeepSeek V3.2 (Non-reasoning)	DeepSeek	24.7	—	$0.28	$0.42	$0.32	0.0	0.00	—	78.4
MiMo-V2.5-Pro	Xiaomi	42.2	60.2	$0.43	$0.87	$0.54	65.2	2.11	—	77.6
Nova Micro	Amazon	4.7	—	$0.04	$0.14	$0.06	289.8	0.59	—	77.0
Gemini 2.5 Flash-Lite Preview (Sep '25) (Non-reasoning)	Google	13.1	—	$0.10	$0.40	$0.17	0.0	0.00	—	74.9
Mistral Small 4 (Reasoning)	Mistral	19.6	26.6	$0.15	$0.60	$0.26	172.1	0.53	—	74.8
MiniMax-M2.7	MiniMax	38.1	52.6	$0.30	$1.20	$0.53	0.0	0.00	—	72.6
Qwen2.5 Turbo	Alibaba	6.3	—	$0.05	$0.20	$0.09	0.0	0.00	—	71.6
Mistral Small 3.2	Mistral	10.6	12.5	$0.10	$0.30	$0.15	0.0	0.00	—	70.7
Step 3.7 Flash	StepFun	30.3	39.6	$0.20	$1.15	$0.44	397.6	0.61	—	69.2
Qwen3.5 Omni Flash	Alibaba	19.0	—	$0.10	$0.80	$0.28	226.4	0.95	—	69.1
Agnes 2.5 Pro Alpha	Sapiens AI	38.8	58.8	$0.45	$0.90	$0.56	133.9	1.93	—	68.9
DeepSeek V3.2 Exp (Non-reasoning)	DeepSeek	21.3	—	$0.28	$0.42	$0.32	0.0	0.00	—	67.6
NVIDIA Nemotron 3 Super 120B A12B (Reasoning)	NVIDIA	25.4	37.7	$0.25	$0.78	$0.38	152.4	0.97	—	66.7
Nova Lite	Amazon	6.9	—	$0.06	$0.24	$0.10	0.0	0.00	—	65.7
GPT-5.4 nano (medium)	OpenAI	30.2	—	$0.20	$1.25	$0.46	0.0	0.00	—	65.2
Gemini 2.5 Flash-Lite (Reasoning)	Google	11.4	—	$0.10	$0.40	$0.17	0.0	0.00	—	65.1
Ministral 3 3B	Mistral	6.5	4.8	$0.10	$0.10	$0.10	248.6	0.40	—	65.0
Grok 3 mini Reasoning (high)	SpaceXAI	22.5	—	$0.30	$0.50	$0.35	0.0	0.00	—	64.3
KAT Coder Pro V2	KwaiKAT	33.7	59.5	$0.30	$1.20	$0.53	103.8	1.12	—	64.2
MiniMax-M2.5	MiniMax	33.7	—	$0.30	$1.20	$0.53	0.0	0.00	—	64.2
Seed-OSS-36B-Instruct	ByteDance Seed	18.3	—	$0.21	$0.57	$0.30	0.0	0.00	—	61.0
Ministral 3 8B	Mistral	9.0	9.7	$0.15	$0.15	$0.15	119.8	0.73	—	60.0
Grok 4 Fast (Non-reasoning)	SpaceXAI	16.5	—	$0.20	$0.50	$0.28	0.0	0.00	—	60.0
MiniMax-M2.1	MiniMax	31.4	—	$0.30	$1.20	$0.53	0.0	0.00	—	59.8
GPT-5 nano (minimal)	OpenAI	8.0	—	$0.05	$0.40	$0.14	0.0	0.00	—	58.0
DeepSeek V4 Pro (Non-reasoning)	DeepSeek	31.2	—	$0.43	$0.87	$0.54	72.7	1.13	—	57.4
Mercury 2	Inception	21.4	31.1	$0.25	$0.75	$0.38	1118.9	3.79	—	57.1
gpt-oss-120b (low)	OpenAI	14.9	21.2	$0.15	$0.60	$0.26	323.7	0.58	—	56.9
Qwen3.6 35B A3B (Reasoning)	Alibaba	31.6	41.9	$0.25	$1.49	$0.56	149.2	1.19	—	56.7
Qwen3.7 Plus	Alibaba	39.0	55.9	$0.40	$1.60	$0.70	52.8	1.73	—	55.7
Ministral 3 14B	Mistral	11.1	14.4	$0.20	$0.20	$0.20	72.3	0.48	—	55.5
GPT-4.1 nano	OpenAI	9.6	11.1	$0.10	$0.40	$0.17	0.0	0.00	—	54.9
MiniMax-M2	MiniMax	28.3	—	$0.30	$1.20	$0.53	0.0	0.00	—	53.9
MiMo-V2.5-Pro (Non-reasoning)	Xiaomi	27.9	—	$0.43	$0.87	$0.54	64.4	2.00	—	51.3
Hermes 4 - Llama-3.1 70B (Reasoning)	Nous Research	10.0	—	$0.13	$0.40	$0.20	93.7	0.58	—	50.5
Granite 4.0 H Small	IBM	5.2	—	$0.06	$0.25	$0.11	406.4	8.74	—	48.6
Gemma 3n E4B Instruct	Google	1.2	3.2	$0.02	$0.04	$0.03	0.0	0.00	—	48.0
Mistral Small 4 (Non-reasoning)	Mistral	12.4	—	$0.15	$0.60	$0.26	155.9	0.53	—	47.3
DeepSeek V3.1 Terminus (Non-reasoning)	DeepSeek	21.4	—	$0.27	$1.00	$0.45	0.0	0.00	—	47.2
Trinity Large Thinking	Arcee AI	18.2	25.8	$0.23	$0.88	$0.40	169.3	0.49	—	46.1
Mistral Small 3	Mistral	6.9	—	$0.10	$0.30	$0.15	0.0	0.00	—	46.0
GPT-5 mini (medium)	OpenAI	30.9	—	$0.25	$2.00	$0.69	0.0	0.00	—	44.9
GPT-5.1 Codex mini (high)	OpenAI	30.6	—	$0.25	$2.00	$0.69	0.0	0.00	—	44.5
Gemini 3.1 Flash-Lite	Google	25.0	34.7	$0.25	$1.50	$0.56	298.6	5.59	—	44.4
GLM-4.5-Air	Z AI	16.5	—	$0.17	$0.98	$0.37	0.0	0.00	—	44.4
Llama 2 Chat 7B	Meta	4.3	—	$0.05	$0.25	$0.10	0.0	0.00	—	43.0
Gemini 3.5 Flash-Lite	Google	36.5	49.3	$0.30	$2.50	$0.85	362.2	7.41	—	42.9
Qwen3.5 35B A3B (Reasoning)	Alibaba	29.3	—	$0.25	$2.00	$0.69	0.0	0.00	—	42.6
Solar Mini	Upstage	6.2	—	$0.15	$0.15	$0.15	0.0	0.00	—	41.3
Nex-N2-Pro	Nex AGI	41.0	59.1	$0.50	$2.50	$1.00	129.2	0.91	—	41.0
Qwen3.5 27B (Reasoning)	Alibaba	33.8	—	$0.30	$2.40	$0.82	0.0	0.00	—	41.0
Gemini 2.5 Flash-Lite (Non-reasoning)	Google	6.9	—	$0.10	$0.40	$0.17	0.0	0.00	—	39.4
Ling-flash-2.0	InclusionAI	9.7	—	$0.14	$0.57	$0.25	0.0	0.00	—	39.3
GPT-5.4 nano (Non-Reasoning)	OpenAI	17.6	—	$0.20	$1.25	$0.46	0.0	0.00	—	38.0
Qwen3 Coder Next	Alibaba	21.1	36.2	$0.35	$1.20	$0.56	123.8	0.97	—	37.5
GLM-4.6V (Reasoning)	Z AI	16.8	—	$0.30	$0.90	$0.45	0.0	0.00	—	37.3
GPT-5 mini (high)	OpenAI	25.3	15.6	$0.25	$2.00	$0.69	0.0	0.00	—	36.8
Ring-2.6-1T	InclusionAI	30.6	42.8	$0.30	$2.50	$0.85	127.8	1.94	—	36.0
Qwen3.5 27B (Non-reasoning)	Alibaba	29.3	—	$0.30	$2.40	$0.82	0.0	0.00	—	35.5
Qwen3.6 Plus	Alibaba	39.6	54.5	$0.50	$3.00	$1.13	52.6	1.64	—	35.2
Qwen3.5 35B A3B (Non-reasoning)	Alibaba	24.0	37.0	$0.25	$2.00	$0.69	160.9	1.16	—	34.9
Hermes 4 - Llama-3.1 70B (Non-reasoning)	Nous Research	6.9	—	$0.13	$0.40	$0.20	97.0	0.56	—	34.8
Llama 4 Maverick	Meta	14.3	16.3	$0.27	$0.85	$0.41	98.6	0.61	—	34.5
GLM-4.7 (Reasoning)	Z AI	33.7	45.3	$0.60	$2.20	$1.00	0.0	0.00	—	33.7
Gemini 3 Flash Preview (Reasoning)	Google	37.8	—	$0.50	$3.00	$1.13	0.0	0.00	—	33.6
Llama 4 Scout	Meta	10.0	8.2	$0.18	$0.66	$0.30	94.4	0.59	—	33.3
Ring-flash-2.0	InclusionAI	8.2	—	$0.14	$0.57	$0.25	0.0	0.00	—	33.2
Nemotron 3 Ultra 550B A55B (Reasoning)	NVIDIA	37.8	49.3	$0.68	$2.67	$1.18	180.4	0.91	—	32.2
DeepSeek V3 0324	DeepSeek	15.4	21.2	$0.27	$1.12	$0.48	0.0	0.00	—	31.9
Grok Build 0.1 0616	SpaceXAI	39.8	51.5	$1.00	$2.00	$1.25	0.0	0.00	—	31.8
Llama Nemotron Super 49B v1.5 (Reasoning)	NVIDIA	12.4	—	$0.40	$0.40	$0.40	63.9	5.30	—	31.0
Ling-2.6-1T	InclusionAI	26.1	—	$0.30	$2.50	$0.85	0.0	0.00	—	30.7
Kimi K2 Thinking	Kimi	32.7	—	$0.60	$2.50	$1.07	0.0	0.00	—	30.4
NVIDIA Nemotron Nano 12B v2 VL (Reasoning)	NVIDIA	9.0	—	$0.20	$0.60	$0.30	49.3	5.88	—	30.0
GLM-4.6 (Reasoning)	Z AI	28.7	45.8	$0.55	$2.20	$0.96	0.0	0.00	—	29.8
Kimi K2.5 (Reasoning)	Kimi	35.4	46.8	$0.60	$3.00	$1.20	0.0	0.00	—	29.5
Qwen3.5 122B A10B (Reasoning)	Alibaba	32.3	45.7	$0.40	$3.20	$1.10	135.3	1.00	—	29.4
DeepSeek V3 (Dec '24)	DeepSeek	14.2	23.0	$0.36	$0.89	$0.49	0.0	0.00	—	28.8
Qwen3.6 35B A3B (Non-reasoning)	Alibaba	24.2	28.1	$0.38	$2.25	$0.84	158.1	1.42	—	28.7
Qwen3 VL 30B A3B Instruct	Alibaba	10.0	—	$0.20	$0.80	$0.35	0.0	0.00	—	28.6
Qwen3.6 27B (Reasoning)	Alibaba	37.1	53.7	$0.60	$3.60	$1.35	58.4	1.43	—	27.5
Qwen3 VL 8B Instruct	Alibaba	8.4	—	$0.18	$0.70	$0.31	0.0	0.00	—	27.1
GLM-4.7 (Non-reasoning)	Z AI	26.6	—	$0.60	$2.20	$1.00	0.0	0.00	—	26.6
GPT-4o mini	OpenAI	6.9	11.4	$0.15	$0.60	$0.26	0.0	0.00	—	26.3
Qwen3 30B A3B 2507 Instruct	Alibaba	9.1	—	$0.20	$0.80	$0.35	0.0	0.00	—	26.0
Kimi K2.6	Kimi	44.2	61.8	$0.95	$4.00	$1.71	0.0	0.00	—	25.8
GLM-5 (Reasoning)	Z AI	39.5	—	$1.00	$3.20	$1.55	0.0	0.00	—	25.5
Muse Spark 1.1 (xhigh)	Meta	50.6	71.3	$1.25	$4.25	$2.00	123.9	1.02	—	25.3
Qwen3.5 122B A10B (Non-reasoning)	Alibaba	27.6	43.3	$0.40	$3.20	$1.10	152.3	1.01	—	25.1
DeepSeek V3.1 (Non-reasoning)	DeepSeek	21.0	—	$0.56	$1.68	$0.84	0.0	0.00	—	25.0
Qwen3.5 397B A17B (Reasoning)	Alibaba	33.7	48.2	$0.60	$3.60	$1.35	66.3	1.55	—	25.0
Nova 2.0 Omni (medium)	Amazon	20.9	—	$0.30	$2.50	$0.85	0.0	0.00	—	24.6
Kimi K2.5 (Non-reasoning)	Kimi	29.4	—	$0.60	$3.00	$1.20	0.0	0.00	—	24.5
Kimi K2.7 Code	Kimi	41.9	60.8	$0.95	$4.00	$1.71	44.6	1.28	—	24.5
GLM-4.6V (Non-reasoning)	Z AI	11.0	—	$0.30	$0.90	$0.45	0.0	0.00	—	24.4
Gemini 3 Flash Preview (Non-reasoning)	Google	27.4	—	$0.50	$3.00	$1.13	0.0	0.00	—	24.4
Grok 4.3 (high)	SpaceXAI	37.6	42.2	$1.25	$2.50	$1.56	0.0	0.00	—	24.1
DeepSeek V3.1 (Reasoning)	DeepSeek	20.7	—	$0.59	$1.69	$0.86	0.0	0.00	—	23.9
GLM-5.2 (max)	Z AI	51.1	68.8	$1.40	$4.40	$2.15	156.7	0.91	—	23.8
Qwen3.5 397B A17B (Non-reasoning)	Alibaba	32.0	—	$0.60	$3.60	$1.35	64.1	1.39	—	23.7
GPT-5.4 mini (xhigh)	OpenAI	40.0	56.1	$0.75	$4.50	$1.69	0.0	0.00	—	23.7
Gemini 2.5 Flash (Reasoning)	Google	20.1	—	$0.30	$2.50	$0.85	0.0	0.00	—	23.6
GLM-4.6 (Non-reasoning)	Z AI	23.0	—	$0.57	$2.20	$0.98	0.0	0.00	—	23.4
Grok 4.3 (medium)	SpaceXAI	36.0	—	$1.25	$2.50	$1.56	100.8	21.63	—	23.0
GPT-5.6 Luna (max)	OpenAI	51.2	71.4	$1.00	$6.00	$2.25	171.4	86.83	—	22.8
Grok 4.3 (low)	SpaceXAI	35.4	—	$1.25	$2.50	$1.56	93.0	8.88	—	22.6
Qwen3.6 27B (Non-reasoning)	Alibaba	30.5	46.6	$0.60	$3.60	$1.35	57.1	1.44	—	22.6
Olmo 3 7B Instruct	Allen Institute for AI	2.8	—	$0.10	$0.20	$0.13	0.0	0.00	—	22.4
Phi-4	Microsoft	4.9	—	$0.13	$0.50	$0.22	43.6	0.54	—	22.4
Nova 2.0 Lite (medium)	Amazon	19.0	—	$0.30	$2.50	$0.85	165.8	15.89	—	22.4
Qwen3 Omni 30B A3B (Reasoning)	Alibaba	9.6	—	$0.25	$0.97	$0.43	107.9	0.92	—	22.3
Kimi K2 0905	Kimi	23.5	—	$0.60	$2.50	$1.07	0.0	0.00	—	21.9
GPT-5.6 Luna (xhigh)	OpenAI	49.1	68.6	$1.00	$6.00	$2.25	161.2	36.09	—	21.8
Llama Nemotron Super 49B v1.5 (Non-reasoning)	NVIDIA	8.7	—	$0.40	$0.40	$0.40	55.8	4.84	—	21.7
Nova 2.0 Lite (high)	Amazon	18.2	23.0	$0.30	$2.50	$0.85	175.6	14.97	—	21.4
Mistral Large 3	Mistral	15.9	20.1	$0.50	$1.50	$0.75	65.3	0.64	—	21.2
Granite 3.3 8B (Non-reasoning)	IBM	1.8	—	$0.03	$0.25	$0.09	0.0	0.00	—	21.2
GPT-4.1 mini	OpenAI	14.8	20.2	$0.40	$1.60	$0.70	0.0	0.00	—	21.1
Nova 2.0 Lite (low)	Amazon	17.8	—	$0.30	$2.50	$0.85	179.3	5.53	—	20.9
GLM-5 (Non-reasoning)	Z AI	32.4	—	$1.00	$3.20	$1.55	0.0	0.00	—	20.9
GPT-5 mini (minimal)	OpenAI	14.3	—	$0.25	$2.00	$0.69	0.0	0.00	—	20.8
GPT-5.6 Luna (high)	OpenAI	46.1	63.3	$1.00	$6.00	$2.25	174.3	6.21	—	20.5
Qwen3.5 Omni Plus	Alibaba	30.6	—	$0.40	$4.80	$1.50	52.4	1.26	—	20.4
Kimi K2.6 (Non-reasoning)	Kimi	34.6	—	$0.95	$4.00	$1.71	28.8	1.45	—	20.2
Qwen2.5 Instruct 72B	Alibaba	9.6	—	$0.47	$0.49	$0.48	0.0	0.00	—	20.0
Nova 2.0 Omni (low)	Amazon	16.6	—	$0.30	$2.50	$0.85	0.0	0.00	—	19.5
Qwen3 30B A3B (Non-reasoning)	Alibaba	6.8	—	$0.20	$0.80	$0.35	0.0	0.00	—	19.4
Kimi K2	Kimi	19.4	—	$0.57	$2.30	$1.00	0.0	0.00	—	19.4
Qwen3 30B A3B 2507 (Reasoning)	Alibaba	14.4	12.1	$0.20	$2.40	$0.75	0.0	0.00	—	19.2
GLM-5.1 (Reasoning)	Z AI	40.2	55.8	$1.40	$4.40	$2.15	0.0	0.00	—	18.7
ERNIE 4.5 300B A47B	Baidu	9.0	—	$0.28	$1.10	$0.48	0.0	0.00	—	18.6
MiniMax M1 80k	MiniMax	17.7	—	$0.55	$2.20	$0.96	0.0	0.00	—	18.4
Mistral Medium 3.1	Mistral	14.7	20.5	$0.40	$2.00	$0.80	0.0	0.00	—	18.4
Reka Flash (Sep '24)	Reka AI	6.3	—	$0.20	$0.80	$0.35	0.0	0.00	—	18.0
QwQ 32B	Alibaba	13.4	—	$0.66	$1.00	$0.74	0.0	0.00	—	18.0
Grok 4.5 (high)	SpaceXAI	53.8	72.4	$2.00	$6.00	$3.00	55.8	12.63	—	17.9
Qwen3 VL 30B A3B (Reasoning)	Alibaba	13.3	—	$0.20	$2.40	$0.75	0.0	0.00	—	17.7
GPT-5.4 mini (medium)	OpenAI	29.8	—	$0.75	$4.50	$1.69	0.0	0.00	—	17.7
Llama 3 Instruct 8B	Meta	1.2	—	$0.04	$0.14	$0.07	0.0	0.00	—	17.1
GPT-5.6 Luna (medium)	OpenAI	38.1	50.7	$1.00	$6.00	$2.25	167.3	2.56	—	16.9
Gemini 3.6 Flash (high)	Google	50.1	69.2	$1.50	$7.50	$3.00	243.9	13.00	—	16.7
Gemini 2.5 Flash (Non-reasoning)	Google	14.1	—	$0.30	$2.50	$0.85	0.0	0.00	—	16.6
GLM-5.1 (Non-reasoning)	Z AI	35.4	—	$1.40	$4.40	$2.15	0.0	0.00	—	16.5
Qwen3 8B (Non-reasoning)	Alibaba	5.1	—	$0.18	$0.70	$0.31	0.0	0.00	—	16.5
Qwen3 VL 8B (Reasoning)	Alibaba	10.6	—	$0.18	$2.10	$0.66	0.0	0.00	—	16.1
DeepSeek V3.1 Terminus (Reasoning)	DeepSeek	30.4	43.5	$1.64	$2.75	$1.91	0.0	0.00	—	15.9
Grok 4.3 (Non-reasoning)	SpaceXAI	24.8	35.2	$1.25	$2.50	$1.56	96.1	1.31	—	15.9
GLM-5.2 (Non-reasoning)	Z AI	34.1	46.5	$1.40	$4.40	$2.15	85.7	1.86	—	15.9
Inkling (xhigh)	Thinking Machines	40.7	52.1	$1.87	$4.68	$2.57	62.8	2.40	—	15.8
Mistral Small (Sep '24)	Mistral	4.7	—	$0.20	$0.60	$0.30	0.0	0.00	—	15.7
Qwen3 Next 80B A3B Instruct	Alibaba	13.7	—	$0.50	$2.00	$0.88	190.7	1.01	—	15.7
Mistral Medium 3	Mistral	12.5	—	$0.40	$2.00	$0.80	0.0	0.00	—	15.6
NVIDIA Nemotron Nano 12B v2 VL (Non-reasoning)	NVIDIA	4.6	—	$0.20	$0.60	$0.30	195.9	1.59	—	15.3
Llama 3.3 Instruct 70B	Meta	9.4	11.9	$0.59	$0.71	$0.62	81.1	0.65	—	15.2
Qwen3 Coder 30B A3B Instruct	Alibaba	13.6	—	$0.45	$2.25	$0.90	0.0	0.00	—	15.1
Magistral Small 1.2	Mistral	11.3	14.7	$0.50	$1.50	$0.75	90.1	0.47	—	15.1
Gemini 3.5 Flash (high)	Google	50.2	70.1	$1.50	$9.00	$3.38	250.3	17.16	—	14.9
Qwen3 235B A22B 2507 Instruct	Alibaba	18.2	—	$0.70	$2.80	$1.23	0.0	0.00	—	14.9
Claude 4.5 Haiku (Reasoning)	Anthropic	29.6	43.9	$1.00	$5.00	$2.00	150.2	15.73	—	14.8
GPT-5.6 Luna (low)	OpenAI	33.3	44.2	$1.00	$6.00	$2.25	162.7	1.27	—	14.8
Nova 2.0 Lite (Non-reasoning)	Amazon	11.8	—	$0.30	$2.50	$0.85	225.2	0.83	—	13.9
Qwen3.6 Max Preview	Alibaba	40.0	—	$1.30	$7.80	$2.92	0.0	0.00	—	13.7
Gemini 3.5 Flash (medium)	Google	45.4	—	$1.50	$9.00	$3.38	265.2	11.90	—	13.5
Claude Sonnet 5 (Adaptive Reasoning, Max Effort)	Anthropic	53.4	71.5	$2.00	$10.00	$4.00	83.4	108.38	—	13.3
o4-mini (high)	OpenAI	25.6	—	$1.10	$4.40	$1.93	0.0	0.00	—	13.3
DeepSeek R1 Distill Llama 70B	DeepSeek	9.9	—	$0.70	$1.05	$0.79	0.0	0.00	—	12.6
Qwen3 8B (Reasoning)	Alibaba	8.3	9.0	$0.18	$2.10	$0.66	0.0	0.00	—	12.6
Qwen3 30B A3B (Reasoning)	Alibaba	9.3	—	$0.20	$2.40	$0.75	0.0	0.00	—	12.4
Nova 2.0 Omni (Non-reasoning)	Amazon	10.5	—	$0.30	$2.50	$0.85	0.0	0.00	—	12.4
Grok 4.20 0309 v2 (Reasoning)	SpaceXAI	37.0	—	$2.00	$6.00	$3.00	0.0	0.00	—	12.3
Qwen3.7 Max	Alibaba	46.0	66.0	$2.50	$7.50	$3.75	199.6	1.60	—	12.3
Grok 4.20 0309 (Reasoning)	SpaceXAI	36.5	—	$2.00	$6.00	$3.00	0.0	0.00	—	12.2
Llama 3.1 Instruct 70B	Meta	6.8	—	$0.56	$0.56	$0.56	0.0	0.00	—	12.1
Qwen3 Omni 30B A3B Instruct	Alibaba	5.1	—	$0.25	$0.97	$0.43	108.0	0.92	—	11.9
Claude 4.5 Haiku (Non-reasoning)	Anthropic	23.7	—	$1.00	$5.00	$2.00	110.7	0.71	—	11.8
GPT-5.6 Luna (Non-reasoning)	OpenAI	26.6	39.3	$1.00	$6.00	$2.25	162.9	0.61	—	11.8
Reka Flash 3	Reka AI	4.1	—	$0.20	$0.80	$0.35	96.1	16.10	—	11.7
Qwen3 VL 235B A22B Instruct	Alibaba	14.3	—	$0.70	$2.80	$1.23	0.0	0.00	—	11.7
Qwen3 14B (Non-reasoning)	Alibaba	7.0	—	$0.35	$1.40	$0.61	0.0	0.00	—	11.4
Jamba 1.5 Mini	AI21 Labs	2.7	—	$0.20	$0.40	$0.25	0.0	0.00	—	10.8
GPT-5.1 (high)	OpenAI	36.9	49.4	$1.25	$10.00	$3.44	0.0	0.00	—	10.7
GPT-5 Codex (high)	OpenAI	36.1	—	$1.25	$10.00	$3.44	0.0	0.00	—	10.5
Claude Sonnet 5 (Non-reasoning, High Effort)	Anthropic	41.7	66.4	$2.00	$10.00	$4.00	64.3	1.22	—	10.4
Qwen3 Max Thinking (Preview)	Alibaba	25.0	—	$1.20	$6.00	$2.40	0.0	0.00	—	10.4
Jamba 1.6 Mini	AI21 Labs	2.6	—	$0.20	$0.40	$0.25	0.0	0.00	—	10.4
Gemini 3.5 Flash (minimal)	Google	34.9	—	$1.50	$9.00	$3.38	228.3	0.82	—	10.3
Gemini 3.1 Pro Preview	Google	46.5	68.8	$2.00	$12.00	$4.50	132.2	30.98	—	10.3
Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)	NVIDIA	9.1	—	$0.60	$1.80	$0.90	53.5	0.70	—	10.1
GLM-4.5V (Reasoning)	Z AI	9.1	—	$0.60	$1.80	$0.90	0.0	0.00	—	10.1
GPT-5.1 Codex (high)	OpenAI	34.7	—	$1.25	$10.00	$3.44	0.0	0.00	—	10.1
GPT-5 (high)	OpenAI	34.7	37.8	$1.25	$10.00	$3.44	0.0	0.00	—	10.1
Qwen3 Max	Alibaba	24.0	—	$1.20	$6.00	$2.40	0.0	0.00	—	10.0
Mistral Medium 3.5	Mistral	29.9	46.9	$1.50	$7.50	$3.00	91.3	0.72	—	10.0
o3-mini	OpenAI	19.0	—	$1.10	$4.40	$1.93	0.0	0.00	—	9.9
GPT-5.4 mini (Non-Reasoning)	OpenAI	16.6	—	$0.75	$4.50	$1.69	0.0	0.00	—	9.8
GPT-5 (medium)	OpenAI	33.7	—	$1.25	$10.00	$3.44	0.0	0.00	—	9.8
GPT-5.6 Terra (max)	OpenAI	55.0	76.7	$2.50	$15.00	$5.63	128.0	110.14	—	9.8
DeepSeek R1 0528 (May '25)	DeepSeek	20.1	—	$1.35	$4.20	$2.06	0.0	0.00	—	9.7
Kimi K3	Kimi	57.1	76.2	$3.00	$15.00	$6.00	33.1	102.96	—	9.5
Llama 3.2 Instruct 11B (Vision)	Meta	3.3	—	$0.36	$0.36	$0.36	16.7	0.61	—	9.2
GPT-5.3 Codex (xhigh)	OpenAI	44.3	—	$1.75	$14.00	$4.81	125.8	53.33	—	9.2
GPT-5.6 Terra (xhigh)	OpenAI	51.6	70.6	$2.50	$15.00	$5.63	120.0	7.70	—	9.2
GPT-5.4 (xhigh)	OpenAI	51.4	71.1	$2.50	$15.00	$5.63	0.0	0.00	—	9.1
GPT-5 (low)	OpenAI	31.2	—	$1.25	$10.00	$3.44	0.0	0.00	—	9.1
Qwen3 VL 32B Instruct	Alibaba	11.1	—	$0.70	$2.80	$1.23	0.0	0.00	—	9.1
Qwen3 Next 80B A3B (Reasoning)	Alibaba	16.7	17.4	$0.50	$6.00	$1.88	182.1	1.10	—	8.9
Qwen3 235B A22B (Non-reasoning)	Alibaba	10.9	—	$0.70	$2.80	$1.23	0.0	0.00	—	8.9
Gemini 3 Pro Preview (high)	Google	39.6	—	$2.00	$12.00	$4.50	0.0	0.00	—	8.8
GPT-5.2 (xhigh)	OpenAI	42.2	—	$1.75	$14.00	$4.81	0.0	0.00	—	8.8
GPT-5.6 Terra (high)	OpenAI	49.0	67.1	$2.50	$15.00	$5.63	114.6	2.44	—	8.7
o3	OpenAI	30.4	—	$2.00	$8.00	$3.50	149.3	7.35	—	8.7
Mistral 7B Instruct	Mistral	2.1	—	$0.25	$0.25	$0.25	0.0	0.00	—	8.4
GPT-5.2 Codex (xhigh)	OpenAI	40.1	—	$1.75	$14.00	$4.81	0.0	0.00	—	8.3
GPT-5.6 Terra (medium)	OpenAI	45.6	64.7	$2.50	$15.00	$5.63	116.0	1.78	—	8.1
o3-mini (high)	OpenAI	15.6	16.3	$1.10	$4.40	$1.93	0.0	0.00	—	8.1
Apertus 8B Instruct	Swiss AI Initiative	1.0	—	$0.10	$0.20	$0.13	0.0	0.00	—	8.0
Qwen3 Max (Preview)	Alibaba	19.2	—	$1.20	$6.00	$2.40	0.0	0.00	—	8.0
Qwen3 14B (Reasoning)	Alibaba	10.4	13.8	$0.35	$4.20	$1.31	0.0	0.00	—	7.9
GPT-5.2 (medium)	OpenAI	38.0	—	$1.75	$14.00	$4.81	0.0	0.00	—	7.9
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)	Anthropic	47.2	63.0	$3.00	$15.00	$6.00	0.0	0.00	—	7.9
Qwen3 VL 235B A22B (Reasoning)	Alibaba	20.6	—	$0.70	$8.40	$2.63	0.0	0.00	—	7.8
Claude 3 Haiku	Anthropic	3.9	—	$0.25	$1.25	$0.50	0.0	0.00	—	7.8
GLM-4.5V (Non-reasoning)	Z AI	7.0	—	$0.60	$1.80	$0.90	0.0	0.00	—	7.8
DeepSeek R1 (Jan '25)	DeepSeek	18.5	24.6	$1.68	$4.70	$2.43	0.0	0.00	—	7.6
Gemini 2.5 Pro	Google	25.8	33.3	$1.25	$10.00	$3.44	135.1	20.87	—	7.5
Grok 4.20 0309 (Non-reasoning)	SpaceXAI	22.5	—	$2.00	$6.00	$3.00	0.0	0.00	—	7.5
Qwen3 235B A22B 2507 (Reasoning)	Alibaba	19.6	22.1	$0.70	$8.40	$2.63	0.0	0.00	—	7.5
Gemini 3 Pro Preview (low)	Google	33.1	—	$2.00	$12.00	$4.50	0.0	0.00	—	7.4
Hermes 3 - Llama-3.1 70B	Nous Research	5.1	—	$0.70	$0.70	$0.70	0.0	0.00	—	7.3
Grok 4.20 0309 v2 (Non-reasoning)	SpaceXAI	21.8	—	$2.00	$6.00	$3.00	0.0	0.00	—	7.3
GPT-5.6 Terra (low)	OpenAI	40.5	58.1	$2.50	$15.00	$5.63	111.2	1.30	—	7.2
Qwen3 32B (Non-reasoning)	Alibaba	8.6	—	$0.70	$2.80	$1.23	0.0	0.00	—	7.0
GPT-5.4 (low)	OpenAI	39.1	—	$2.50	$15.00	$5.63	0.0	0.00	—	7.0
Qwen3 VL 32B (Reasoning)	Alibaba	17.9	—	$0.70	$8.40	$2.63	0.0	0.00	—	6.8
Magistral Medium 1.2	Mistral	17.9	21.3	$2.00	$5.00	$2.75	43.6	0.58	—	6.5
Gemini 2.5 Pro Preview (May' 25)	Google	22.3	—	$1.25	$10.00	$3.44	0.0	0.00	—	6.5
Nova 2.0 Pro Preview (medium)	Amazon	21.8	34.0	$1.25	$10.00	$3.44	135.7	18.49	—	6.3
Llama 3.1 Nemotron Instruct 70B	NVIDIA	7.6	—	$1.20	$1.20	$1.20	69.3	4.55	—	6.3
Claude Opus 5 (Adaptive Reasoning, Max Effort)	Anthropic	60.7	78.0	$5.00	$25.00	$10.00	43.9	28.70	—	6.1
Claude 4.5 Sonnet (Reasoning)	Anthropic	36.4	52.1	$3.00	$15.00	$6.00	0.0	0.00	—	6.1
GPT-5.6 Terra (Non-reasoning)	OpenAI	34.0	52.3	$2.50	$15.00	$5.63	118.7	0.68	—	6.0
Claude Opus 5 (Adaptive Reasoning, Xhigh Effort)	Anthropic	60.1	77.0	$5.00	$25.00	$10.00	60.4	22.56	—	6.0
Hermes 4 - Llama-3.1 405B (Reasoning)	Nous Research	9.0	—	$1.00	$3.00	$1.50	37.2	0.77	—	6.0
Qwen3 Coder 480B A35B Instruct	Alibaba	18.0	—	$1.50	$7.50	$3.00	0.0	0.00	—	6.0
Claude Sonnet 4.6 (Non-reasoning, High Effort)	Anthropic	35.9	—	$3.00	$15.00	$6.00	0.0	0.00	—	6.0
GPT-5.1 (Non-reasoning)	OpenAI	20.4	—	$1.25	$10.00	$3.44	0.0	0.00	—	5.9
Claude Opus 5 (Adaptive Reasoning, High Effort)	Anthropic	58.9	76.5	$5.00	$25.00	$10.00	63.8	10.20	—	5.9
Hermes 4 - Llama-3.1 405B (Non-reasoning)	Nous Research	8.8	—	$1.00	$3.00	$1.50	35.5	0.78	—	5.9
Claude Sonnet 4.6 (Non-reasoning, Low Effort)	Anthropic	34.3	—	$3.00	$15.00	$6.00	50.3	1.21	—	5.7
Nova 2.0 Pro Preview (low)	Amazon	19.6	25.9	$1.25	$10.00	$3.44	134.1	6.18	—	5.7
Claude Opus 5 (Adaptive Reasoning, Medium Effort)	Anthropic	56.3	74.3	$5.00	$25.00	$10.00	55.6	9.66	—	5.6
Claude Opus 4.8 (Adaptive Reasoning, Max Effort)	Anthropic	55.7	74.3	$5.00	$25.00	$10.00	62.5	46.47	—	5.6
Grok 4	SpaceXAI	33.3	—	$3.00	$15.00	$6.00	0.0	0.00	—	5.5
GPT-4.1	OpenAI	19.4	—	$2.00	$8.00	$3.50	0.0	0.00	—	5.5
Nova Pro	Amazon	7.7	—	$0.80	$3.20	$1.40	0.0	0.00	—	5.5
GPT-5.2 (Non-reasoning)	OpenAI	26.0	—	$1.75	$14.00	$4.81	0.0	0.00	—	5.4
Claude Opus 4.7 (Adaptive Reasoning, Max Effort)	Anthropic	53.5	73.6	$5.00	$25.00	$10.00	0.0	0.00	—	5.3
GPT-5.6 Sol (max)	OpenAI	58.9	77.4	$5.00	$30.00	$11.25	73.9	86.49	—	5.2
GPT-5.6 Sol (xhigh)	OpenAI	57.7	78.3	$5.00	$30.00	$11.25	64.2	31.00	—	5.1
Qwen3 235B A22B (Reasoning)	Alibaba	13.4	—	$0.70	$8.40	$2.63	0.0	0.00	—	5.1
Claude Opus 5 (Adaptive Reasoning, Low Effort)	Anthropic	50.6	66.9	$5.00	$25.00	$10.00	46.7	2.76	—	5.1
GPT-5 (minimal)	OpenAI	17.2	—	$1.25	$10.00	$3.44	0.0	0.00	—	5.0
GPT-5.6 Sol (high)	OpenAI	55.9	77.2	$5.00	$30.00	$11.25	65.8	11.26	—	5.0
GPT-5.4 (Non-reasoning)	OpenAI	27.7	—	$2.50	$15.00	$5.63	0.0	0.00	—	4.9
Claude 4.5 Sonnet (Non-reasoning)	Anthropic	29.3	—	$3.00	$15.00	$6.00	0.0	0.00	—	4.9
GPT-5.5 (xhigh)	OpenAI	54.8	74.9	$5.00	$30.00	$11.25	0.0	0.00	—	4.9
Claude 4 Sonnet (Reasoning)	Anthropic	28.9	37.6	$3.00	$15.00	$6.00	0.0	0.00	—	4.8
GPT-3.5 Turbo	OpenAI	3.6	10.7	$0.50	$1.50	$0.75	0.0	0.00	—	4.8
GPT-5.6 Sol (medium)	OpenAI	53.6	76.3	$5.00	$30.00	$11.25	60.0	5.28	—	4.8
GPT-5.5 (high)	OpenAI	53.1	71.6	$5.00	$30.00	$11.25	0.0	0.00	—	4.7
Mixtral 8x7B Instruct	Mistral	2.4	—	$0.45	$0.70	$0.51	0.0	0.00	—	4.7
GPT-5.5 (medium)	OpenAI	50.4	71.5	$5.00	$30.00	$11.25	0.0	0.00	—	4.5
GPT-5 (ChatGPT)	OpenAI	15.3	—	$1.25	$10.00	$3.44	0.0	0.00	—	4.5
GPT-5.6 Sol (low)	OpenAI	49.4	69.7	$5.00	$30.00	$11.25	69.3	2.80	—	4.4
Qwen3 32B (Reasoning)	Alibaba	11.5	15.3	$0.70	$8.40	$2.63	0.0	0.00	—	4.4
Claude Opus 4.6 (Adaptive Reasoning, Max Effort)	Anthropic	43.7	—	$5.00	$25.00	$10.00	0.0	0.00	—	4.4
Claude Opus 4.7 (Non-reasoning, High Effort)	Anthropic	42.7	—	$5.00	$25.00	$10.00	46.3	1.52	—	4.3
Claude 4 Sonnet (Non-reasoning)	Anthropic	25.5	—	$3.00	$15.00	$6.00	0.0	0.00	—	4.3
Nova 2.0 Pro Preview (Non-reasoning)	Amazon	14.4	20.9	$1.25	$10.00	$3.44	128.7	0.71	—	4.2
Claude Opus 4.5 (Reasoning)	Anthropic	40.8	—	$5.00	$25.00	$10.00	0.0	0.00	—	4.1
Claude 3.7 Sonnet (Non-reasoning)	Anthropic	23.5	—	$3.00	$15.00	$6.00	0.0	0.00	—	3.9
GPT-5.5 (low)	OpenAI	43.5	60.9	$5.00	$30.00	$11.25	0.0	0.00	—	3.9
Claude Opus 4.6 (Non-reasoning, High Effort)	Anthropic	37.8	—	$5.00	$25.00	$10.00	0.0	0.00	—	3.8
GPT-5.6 Sol (Non-reasoning)	OpenAI	41.2	65.1	$5.00	$30.00	$11.25	71.0	1.07	—	3.7
Claude Opus 4.5 (Non-reasoning)	Anthropic	34.7	—	$5.00	$25.00	$10.00	0.0	0.00	—	3.5
GPT-5.5 (Non-reasoning)	OpenAI	35.4	56.5	$5.00	$30.00	$11.25	0.0	0.00	—	3.1
Llama 3.2 Instruct 90B (Vision)	Meta	6.2	—	$2.04	$2.04	$2.04	0.0	0.00	—	3.0
Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)	Anthropic	59.9	76.5	$10.00	$50.00	$20.00	58.3	52.46	—	3.0
Llama 3 Instruct 70B	Meta	3.5	—	$0.65	$2.75	$1.18	0.0	0.00	—	3.0
GPT-5.5 Instant (May 2026)	OpenAI	33.5	—	$5.00	$30.00	$11.25	0.0	0.00	—	3.0
Command-R (Mar '24)	Cohere	2.1	—	$0.50	$1.50	$0.75	0.0	0.00	—	2.8
GPT-5.5 Instant (June 2026)	OpenAI	28.9	39.4	$5.00	$30.00	$11.25	0.0	0.00	—	2.6
GPT-4o (Nov '24)	OpenAI	11.2	—	$2.50	$10.00	$4.38	0.0	0.00	—	2.6
Nova Premier	Amazon	12.7	—	$2.50	$12.50	$5.00	53.2	1.15	—	2.5
Mistral Large 2 (Jul '24)	Mistral	7.3	—	$2.00	$6.00	$3.00	0.0	0.00	—	2.4
Mistral Small (Feb '24)	Mistral	3.6	—	$1.00	$3.00	$1.50	0.0	0.00	—	2.4
Grok 3	SpaceXAI	18.4	—	$4.00	$20.00	$8.00	0.0	0.00	—	2.3
GPT-4o (Aug '24)	OpenAI	9.6	—	$2.50	$10.00	$4.38	0.0	0.00	—	2.2
Llama 3.1 Instruct 405B	Meta	8.5	—	$2.50	$10.00	$4.38	0.0	0.00	—	1.9
Apertus 70B Instruct	Swiss AI Initiative	2.4	—	$0.82	$2.92	$1.34	0.0	0.00	—	1.8
Command A	Cohere	7.7	—	$2.50	$10.00	$4.38	56.8	0.49	—	1.8
Claude 3.5 Sonnet (Oct '24)	Anthropic	9.9	30.2	$3.00	$15.00	$6.00	0.0	0.00	—	1.7
Jamba 1.7 Large	AI21 Labs	5.3	—	$2.00	$8.00	$3.50	54.8	0.86	—	1.5
Jamba 1.5 Large	AI21 Labs	5.1	—	$2.00	$8.00	$3.50	0.0	0.00	—	1.5
Jamba 1.6 Large	AI21 Labs	5.0	—	$2.00	$8.00	$3.50	0.0	0.00	—	1.4
Claude 3.5 Sonnet (June '24)	Anthropic	8.3	26.0	$3.00	$15.00	$6.00	0.0	0.00	—	1.4
GPT-4o (May '24)	OpenAI	8.6	24.2	$5.00	$15.00	$7.50	0.0	0.00	—	1.1
Claude 4.1 Opus (Reasoning)	Anthropic	33.7	—	$15.00	$75.00	$30.00	0.0	0.00	—	1.1
Claude 4 Opus (Reasoning)	Anthropic	31.0	—	$15.00	$75.00	$30.00	0.0	0.00	—	1.0
Claude 4.1 Opus (Non-reasoning)	Anthropic	28.2	—	$15.00	$75.00	$30.00	0.0	0.00	—	0.9
o3-pro	OpenAI	32.5	—	$20.00	$80.00	$35.00	0.0	0.00	—	0.9
o1	OpenAI	23.4	39.7	$15.00	$60.00	$26.25	0.0	0.00	—	0.9
Mistral Medium	Mistral	3.6	—	$2.75	$8.10	$4.09	0.0	0.00	—	0.9
Claude 4 Opus (Non-reasoning)	Anthropic	25.5	—	$15.00	$75.00	$30.00	0.0	0.00	—	0.8
Claude 3 Sonnet	Anthropic	4.7	—	$3.00	$15.00	$6.00	0.0	0.00	—	0.8
Mistral Large (Feb '24)	Mistral	4.4	—	$4.00	$12.00	$6.00	0.0	0.00	—	0.7
o1-preview	OpenAI	17.0	34.0	$16.50	$66.00	$28.88	0.0	0.00	—	0.6
GPT-4 Turbo	OpenAI	7.9	21.5	$10.00	$30.00	$15.00	0.0	0.00	—	0.5
Command-R+ (Apr '24)	Cohere	3.0	—	$3.00	$15.00	$6.00	0.0	0.00	—	0.5
Claude 3 Opus	Anthropic	11.8	19.5	$15.00	$75.00	$30.00	0.0	0.00	—	0.4
GPT-4	OpenAI	7.0	13.1	$30.00	$60.00	$37.50	0.0	0.00	—	0.2
o1-pro	OpenAI	18.9	—	$150.00	$600.00	$262.50	0.0	0.00	—	0.1
Grok-1	SpaceXAI	6.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Muse Spark	Meta	43.1	58.6	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemma 4 31B (Reasoning)	Google	29.4	43.4	$0.00	$0.00	$0.00	35.3	1.02	—	0.0
DiffusionGemma 26B A4B	Google	13.5	19.7	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemma 3 270M	Google	2.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemma 4 E2B (Reasoning)	Google	9.5	7.2	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemma 4 E2B (Non-reasoning)	Google	6.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Devstral 2	Mistral	19.2	31.3	$0.00	$0.00	$0.00	29.9	0.84	—	0.0
Devstral Small 2	Mistral	17.4	29.3	$0.00	$0.00	$0.00	25.4	0.71	—	0.0
R1 1776	Perplexity	6.3	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Falcon-H1R-7B	TII UAE	9.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Llama 65B	Meta	2.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Phi-4 Mini Instruct	Microsoft	6.0	3.8	$0.00	$0.00	$0.00	46.3	0.35	—	0.0
Phi-4 Multimodal Instruct	Microsoft	4.5	—	$0.00	$0.00	$0.00	20.4	0.35	—	0.0
LFM2.5-1.2B-Instruct	Liquid AI	2.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
LFM2 2.6B	Liquid AI	2.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
LFM2 8B A1B	Liquid AI	1.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
LFM2 24B A2B	Liquid AI	4.9	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
LFM2.5-1.2B-Thinking	Liquid AI	2.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
LFM2.5-VL-1.6B	Liquid AI	1.0	—	$0.00	$0.00	$0.00	364.7	11.08	—	0.0
LFM2.5-8B-A1B	Liquid AI	8.3	—	$0.00	$0.00	$0.00	331.6	1.49	—	0.0
Solar Open 100B (Reasoning)	Upstage	15.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Solar Pro 3	Upstage	14.1	16.2	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Solar Pro 2 (Non-reasoning)	Upstage	7.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Solar Pro 2 (Reasoning)	Upstage	9.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Nemotron Cascade 2 30B A3B	NVIDIA	17.6	25.3	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen Chat 14B	Alibaba	2.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
NVIDIA Nemotron 3 Nano 4B	NVIDIA	8.7	8.0	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Kimi Linear 48B A3B Instruct	Kimi	8.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Step3 VL 10B	StepFun	9.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Molmo 7B-D	Allen Institute for AI	3.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Molmo2-8B	Allen Institute for AI	2.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Olmo 3.1 32B Think	Allen Institute for AI	8.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Olmo 3.1 32B Instruct	Allen Institute for AI	6.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Olmo 3 7B Think	Allen Institute for AI	4.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Granite 4.0 350M	IBM	1.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Granite 4.0 Micro	IBM	2.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Granite 4.0 H 1B	IBM	2.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Granite 4.1 30B	IBM	8.9	10.4	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Granite 4.0 1B	IBM	2.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Granite 4.1 3B	IBM	4.7	4.7	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Granite 4.0 H 350M	IBM	1.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepHermes 3 - Llama-3.1 8B Preview (Non-reasoning)	Nous Research	2.3	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepHermes 3 - Mistral 24B Preview (Non-reasoning)	Nous Research	5.3	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
K-EXAONE (Reasoning)	LG AI Research	22.1	32.1	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Exaone 4.0 1.2B (Non-reasoning)	LG AI Research	2.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
EXAONE 4.0 32B (Non-reasoning)	LG AI Research	6.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
EXAONE 4.0 32B (Reasoning)	LG AI Research	10.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Exaone 4.0 1.2B (Reasoning)	LG AI Research	2.9	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
K-EXAONE (Non-reasoning)	LG AI Research	16.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
EXAONE 4.5 33B	LG AI Research	20.2	23.6	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
MiMo-V2-Omni-0327	Xiaomi	36.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
MiMo-V2-Flash (Feb 2026)	Xiaomi	33.2	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
MiMo-V2-Flash (Non-reasoning)	Xiaomi	24.7	49.8	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
MiMo-V2-Omni	Xiaomi	35.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
ERNIE 5.0 Thinking Preview	Baidu	21.9	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
KAT-Coder-Pro V1	KwaiKAT	28.3	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
INTELLECT-3	Prime Intellect	15.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Motif 3 (Beta)	Motif Technologies	44.1	62.0	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Motif-2-12.7B-Reasoning	Motif Technologies	12.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
K2 Think V2	MBZUAI Institute of Foundation Models	17.3	21.0	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
K2-V2 (medium)	MBZUAI Institute of Foundation Models	12.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
K2-V2 (low)	MBZUAI Institute of Foundation Models	8.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
K2-V2 (high)	MBZUAI Institute of Foundation Models	14.2	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Mi:dm K 2.5 Pro	Korea Telecom	16.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
HyperCLOVA X SEED Think (32B)	Naver	17.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
LongCat Flash Lite	LongCat	17.2	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
LongCat 2.0	LongCat	33.5	45.3	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Tri-21B-Think	Trillion Labs	12.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Tri-21B-think Preview	Trillion Labs	13.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Nanbeige4.1-3B	Nanbeige	11.1	9.6	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
MiniCPM5-1B (Reasoning)	OpenBMB	12.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
MiniCPM5-1B (Non-reasoning)	OpenBMB	11.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
MiniCPM-V 4.6 1.3B	OpenBMB	4.2	0.7	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
JT-MINI	China Mobile	18.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
JT-35B-Flash	China Mobile	28.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
JT-4.1 Flash 236B A21B	China Mobile	38.8	52.4	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
G9v3-3B	AI9Stars	16.1	9.9	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
North Mini Code	Cohere	19.8	36.5	$0.00	$0.00	$0.00	57.0	0.30	—	0.0
Command A+	Cohere	22.5	27.8	$0.00	$0.00	$0.00	197.5	0.17	—	0.0
Tiny Aya Global	Cohere	1.0	—	$0.00	$0.00	$0.00	128.3	0.35	—	0.0
Apriel-v1.6-15B-Thinker	ServiceNow	20.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Jamba 1.7 Mini	AI21 Labs	2.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Jamba Reasoning 3B	AI21 Labs	4.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3.5 2B (Non-reasoning)	Alibaba	5.6	2.4	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3.5 0.8B (Non-reasoning)	Alibaba	3.3	1.2	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3.5 0.8B (Reasoning)	Alibaba	5.5	0.0	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3.5 2B (Reasoning)	Alibaba	6.9	2.9	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3.5 9B (Non-reasoning)	Alibaba	20.3	23.5	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Ling-mini-2.0	InclusionAI	3.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Doubao Seed Code	ByteDance Seed	26.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
o1-mini	OpenAI	14.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
GPT-4.5 (Preview)	OpenAI	13.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
GPT-4o (March 2025, chatgpt-4o-latest)	OpenAI	12.3	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
GPT-4o (ChatGPT)	OpenAI	8.2	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Llama 3.2 Instruct 3B	Meta	4.2	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Llama 3.2 Instruct 1B	Meta	1.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Llama 2 Chat 70B	Meta	3.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Llama 2 Chat 13B	Meta	3.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 2.0 Pro Experimental (Feb '25)	Google	11.8	25.5	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 2.0 Flash (experimental)	Google	10.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 1.5 Pro (Sep '24)	Google	10.0	23.6	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 2.0 Flash-Lite (Preview)	Google	8.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 2.0 Flash (Feb '25)	Google	12.3	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 1.5 Flash (Sep '24)	Google	8.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 1.5 Flash-8B	Google	5.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemma 3 27B Instruct	Google	7.4	10.1	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 2.0 Flash-Lite (Feb '25)	Google	8.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 1.0 Pro	Google	3.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 1.5 Pro (May '24)	Google	6.3	19.8	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemma 3 12B Instruct	Google	5.5	5.8	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 2.5 Flash Preview (Reasoning)	Google	17.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemma 3n E2B Instruct	Google	1.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 2.5 Flash Preview (Sep '25) (Reasoning)	Google	23.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 2.5 Flash Preview (Sep '25) (Non-reasoning)	Google	18.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 2.5 Pro Preview (Mar' 25)	Google	23.0	46.7	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemma 3 1B Instruct	Google	1.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 2.5 Flash Preview (Non-reasoning)	Google	11.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemma 3 4B Instruct	Google	1.1	2.7	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 2.0 Flash Thinking Experimental (Jan '25)	Google	13.3	24.1	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemma 3n E4B Instruct Preview (May '25)	Google	4.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 1.0 Ultra	Google	4.6	17.6	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 1.5 Flash (May '24)	Google	4.9	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
PALM-2	Google	3.2	4.6	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Gemini 2.0 Flash Thinking Experimental (Dec '24)	Google	6.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Claude 3.5 Haiku	Anthropic	12.3	15.9	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Claude Instant	Anthropic	2.1	7.8	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Claude 3.7 Sonnet (Reasoning)	Anthropic	27.1	36.4	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Claude 2.0	Anthropic	3.6	12.9	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Claude 2.1	Anthropic	3.9	14.0	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Mistral Large 2 (Nov '24)	Mistral	9.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Pixtral Large	Mistral	8.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Mixtral 8x22B Instruct	Mistral	4.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Devstral Small (May '25)	Mistral	11.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Magistral Medium 1	Mistral	12.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Magistral Small 1	Mistral	10.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Mistral Saba	Mistral	6.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Devstral Small (Jul '25)	Mistral	9.3	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Devstral Medium	Mistral	12.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepSeek R1 Distill Qwen 32B	DeepSeek	11.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepSeek R1 Distill Qwen 14B	DeepSeek	9.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepSeek-V2.5 (Dec '24)	DeepSeek	6.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepSeek-Coder-V2	DeepSeek	5.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepSeek R1 Distill Llama 8B	DeepSeek	6.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepSeek LLM 67B Chat (V1)	DeepSeek	3.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepSeek R1 Distill Qwen 1.5B	DeepSeek	3.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepSeek Coder V2 Lite Instruct	DeepSeek	3.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepSeek V3.2 Speciale	DeepSeek	22.2	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepSeek R1 0528 Qwen3 8B	DeepSeek	10.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepSeek-V2.5	DeepSeek	6.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DeepSeek-V2-Chat	DeepSeek	3.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Sonar Reasoning	Perplexity	11.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Sonar	Perplexity	9.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Sonar Pro	Perplexity	9.3	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Sonar Reasoning Pro	Perplexity	17.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Grok Beta	SpaceXAI	7.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Grok 4.1 Fast (Non-reasoning)	SpaceXAI	16.9	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Grok 2 (Dec '24)	SpaceXAI	8.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Grok Code Fast 1	SpaceXAI	21.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Grok 4.1 Fast (Reasoning)	SpaceXAI	30.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Grok 3 Reasoning Beta	SpaceXAI	15.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
OpenChat 3.5 (1210)	OpenChat	3.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Phi-3 Mini Instruct 3.8B	Microsoft	4.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
LFM 40B	Liquid AI	3.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
LFM2 1.2B	Liquid AI	1.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Solar Pro 2 (Preview) (Reasoning)	Upstage	12.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Solar Pro 2 (Preview) (Non-reasoning)	Upstage	10.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
DBRX Instruct	Databricks	3.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
MiniMax M1 40k	MiniMax	14.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)	NVIDIA	8.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Llama 3.3 Nemotron Super 49B v1 (Reasoning)	NVIDIA	12.2	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)	NVIDIA	8.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Llama 3.1 Tulu3 405B	Allen Institute for AI	8.3	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
OLMo 2 32B	Allen Institute for AI	5.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
OLMo 2 7B	Allen Institute for AI	3.9	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Olmo 3 32B Think	Allen Institute for AI	6.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
MiMo-V2-Pro	Xiaomi	40.3	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Sarvam M (Reasoning)	Sarvam	3.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
GLM 5V Turbo (Reasoning)	Z AI	34.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
GLM-4.5 (Reasoning)	Z AI	19.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
GLM-5-Turbo	Z AI	38.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Apriel-v1.5-15B-Thinker	ServiceNow	21.2	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Arctic Instruct	Snowflake	3.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen2.5 Max	Alibaba	10.2	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen2.5 Coder Instruct 32B	Alibaba	7.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen2 Instruct 72B	Alibaba	6.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3 VL 4B (Reasoning)	Alibaba	7.9	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
QwQ 32B-Preview	Alibaba	9.2	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen1.5 Chat 110B	Alibaba	4.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen2.5 Instruct 32B	Alibaba	7.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3 VL 4B Instruct	Alibaba	4.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3 4B (Non-reasoning)	Alibaba	6.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3 0.6B (Non-reasoning)	Alibaba	1.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3 4B (Reasoning)	Alibaba	8.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3 1.7B (Reasoning)	Alibaba	2.6	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3 0.6B (Reasoning)	Alibaba	1.3	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3 4B 2507 Instruct	Alibaba	7.1	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3 1.7B (Non-reasoning)	Alibaba	1.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen2.5 Coder Instruct 7B	Alibaba	4.5	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen Chat 72B	Alibaba	3.4	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3 4B 2507 (Reasoning)	Alibaba	12.0	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Qwen3 Max Thinking	Alibaba	31.7	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Ring-1T	InclusionAI	16.2	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0
Ling-1T	InclusionAI	12.8	—	$0.00	$0.00	$0.00	0.0	0.00	—	0.0

Das teuerste Modell ist selten die beste Wahl

In der Branche hält sich hartnäckig die Annahme, dass ein höherer Preis höhere Qualität bedeutet. Die Daten erzählen eine andere Geschichte. Sortiere die Tabelle oben nach Wertung und du wirst sehen, dass viele der bestplatzierten Modelle nur einen Bruchteil der Flaggschiff-Angebote kosten und dabei in Intelligenz- und Coding-Benchmarks gleichziehen oder sie übertreffen.

Das macht im großen Maßstab einen Unterschied. Wenn deine Anwendung eine Million Anfragen pro Tag verarbeitet, ist der Unterschied zwischen einem $2/M-Modell und einem $0,20/M-Modell kein Rundungsfehler — es sind tausende Dollar pro Monat. Und das günstigere Modell ist möglicherweise sogar schneller, weil kleinere oder besser optimierte Modelle oft einen höheren Durchsatz erreichen.

Die Flaggschiff-Modelle der größten Anbieter führen bei den schwierigsten Benchmarks — Spitzenmathematik, Wissenschaft auf Promotionsniveau, komplexes mehrstufiges Reasoning. Aber die meisten Produktions-Workloads sind keine Promotions-Wissenschaft. Es geht um Klassifikation, Extraktion, Zusammenfassung, Code-Generierung und Konversation. Dafür ist ein Mittelklasse-Modell kein Kompromiss — es ist das richtige Werkzeug.

Reasoning-Modelle fügen eine weitere Dimension hinzu. Sie verwenden zusätzliche Rechenleistung zum „Denken“ vor der Antwort, was die Genauigkeit bei schwierigen Problemen steigert, aber auch Latenz und Kosten erhöht. Wenn dein Anwendungsfall kein mehrstufiges logisches Schließen erfordert, liefert ein Standardmodell die gleiche Antwort in einem Zehntel der Zeit.

Die Wertung in dieser Tabelle — Intelligenz geteilt durch Mischpreis — macht diesen Kompromiss auf einen Blick sichtbar. Das beste Modell für dein Projekt ist nicht das intelligenteste verfügbare. Es ist das intelligenteste, das du brauchst, zum niedrigsten Preis, der es liefert.

Wenn du auf europäischer Infrastruktur aufbaust und Anbieter finden willst, die Datensouveränität respektieren, schau dir Voie.fi an — ein offenes Verzeichnis von über 1.400 europäischen Anbietern digitaler Infrastruktur in den Bereichen Compute, Speicher, Zahlungen, Sicherheit, KI und mehr.