Deepseek v3.2

DeepSeek V3.2 is the latest direct DeepSeek model featuring DeepSeek Sparse Attention (DSA) for high efficiency. It delivers long-context handling up to 163k tokens with reduced inference costs.

Parameters

685000000000 B

Context

163,840 tokens

Released

Jan 12, 2025

Leaderboards

QUALITY

Average Score combining domain-specific Autobench scores; Higher is better

Deepseek-v3.2
4.11

PRICE

USD cent per average answer; Lower is better

Deepseek-v3.2
0.09

LATENCY

Average Latency in Seconds; Lower is better

Deepseek-v3.2
125.00s

gemini-2.5-flash-lite
20.00s
grok-4.1-fast
24.00s
Ministral-8b-2512
31.00s
Gpt-oss-20b
39.00s
nova-premier-v1
52.00s
Mistral-medium-3.1
52.00s
Nova-2-lite-v1
61.00s
gemini-2.5-flash
66.00s
nemotron-nano-9b-v2
67.00s
grok-4.1-fast-thinking
69.00s
gpt-oss-120b
75.00s
llama-3.3-nemotron-super-49b-v1.5
76.00s
gemini-3-pro-preview
76.00s
Qwen3-next-80b-a3b-thinking
78.00s
Kimi-K2-0905
83.00s
gemini-2.5-pro
87.00s
Mistral-large-2512
90.00s
gpt-5-mini
93.00s
gpt-5-nano
100.00s
Qwen3-235B-A22B-2507
105.00s
claude-haiku-4.5
111.00s
Gpt-5.2
130.00s
Minimax-m2
137.00s
Claude-opus-4.5
144.00s
GLM-4.5-Air
163.00s
claude-sonnet-4.5
170.00s
deepSeek-R1-0528
171.00s
grok-4
180.00s
GLM-4.6
187.00s
gpt-5.1
227.00s
Kimi-K2-thinking
248.00s
Gpt-5.2-pro
261.00s
Deepseek-v3.2-speciale
310.00s
Qwen3-235B-A22B-Thinking-2507
317.00s

Performance vs. Industry Average

Intelligence

Deepseek v3.2 is of higher intelligence compared to average (4.1), with an intelligence score of 4.1.

Price

Deepseek v3.2 is cheaper compared to average ($4.91 per 1M Tokens) with a price of $0.09 per 1M Tokens.

Latency

Deepseek v3.2 has a higher average latency compared to average (120.77s), with an average latency of 124.57s.

P99 Latency

Deepseek v3.2 has a higher P99 latency compared to average (354.03s), taking 410.46s to receive the first token at P99 (TTFT).

Context Window

Deepseek v3.2 has a smaller context window than average (347k tokens), with a context window of 164k tokens.