返回模型列表
DeepSeek V3.2
deepseekdeepseek/deepseek-v3.2
API 使用指南
Chat 调用
通过 TheRouter 的 OpenAI 兼容接口做标准对话。TheRouter 在上游统一处理 tool-calling 与 response_format,客户端代码可在 DeepSeek、Anthropic、OpenAI 之间保持可移植。
cURL
curl https://api.therouter.ai/v1/chat/completions \
-H "Authorization: Bearer $THEROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek/deepseek-v3.2",
"messages": [{"role": "user", "content": "Prove that the sum of two odd integers is even."}]
}'流式输出
为聊天界面做流式输出。DSA 不影响流式语义——首 token 延迟与 V3.1-Terminus 相当,在长 prompt 上显著低于密集注意力基线。
cURL
curl https://api.therouter.ai/v1/chat/completions \
-H "Authorization: Bearer $THEROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek/deepseek-v3.2",
"stream": true,
"messages": [{"role": "user", "content": "Explain MoE load balancing in 200 words."}]
}'工具调用
DeepSeek V3.2 支持 OpenAI 形态的 function calling 与 tool_choice。当旗舰定价不合算时,可作为工具型 agent 的主力模型。
cURL
curl https://api.therouter.ai/v1/chat/completions \
-H "Authorization: Bearer $THEROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek/deepseek-v3.2",
"messages": [{"role": "user", "content": "What is the AWS S3 region for ap-northeast-1?"}],
"tools": [{
"type": "function",
"function": {
"name": "lookup_region",
"parameters": {"type": "object", "properties": {"code": {"type": "string"}}}
}
}]
}'结构化 JSON 输出
通过 response_format 强制 JSON 输出。高风险抽取场景下,建议同时在 system prompt 中给出 schema——V3.2 对显式结构约定的遵守度很稳定。
cURL
curl https://api.therouter.ai/v1/chat/completions \
-H "Authorization: Bearer $THEROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek/deepseek-v3.2",
"response_format": {"type": "json_object"},
"messages": [
{"role": "system", "content": "Return JSON: {\"action\":string,\"args\":object}"},
{"role": "user", "content": "Restart the nginx container on host web-03."}
]
}'自托管
V3.2 权重可在 DeepSeek Model License(允许商用)下下载。参考推理配方覆盖 SGLang、vLLM、LMDeploy、TensorRT-LLM、LightLLM、DeepSeek-Infer,FP8 与 BF16 均支持。SGLang 同时支持 AMD GPU;通过 MindIE 可在华为昇腾 NPU 上运行。下方是模型卡里给出的 SGLang 标准启动命令。
cURL
# Reference SGLang launch (FP8). See HF model card for exact tensor-parallel sizing.
python -m sglang.launch_server \
--model deepseek-ai/DeepSeek-V3.2 \
--tp 8 \
--trust-remote-code \
--port 30000
# Then call it through TheRouter as model="deepseek/deepseek-v3.2"
# with TheRouter configured to use your self-hosted endpoint as the upstream.事实档案 — 本页每条断言可在此回溯来源
| 来源 | URL | 采集于 | |
|---|---|---|---|
| 发布日期(V3.2 正式版) | arxiv.org ↗ | 2026-05-22 | 已核实 |
| V3.2-Exp 发布 | api-docs.deepseek.com ↗ | 2026-05-22 | 已核实 |
| 架构 | arxiv.org ↗ | 2026-05-22 | 已核实 |
| 预训练 token 量(V3 主干) | github.com ↗ | 2026-05-22 | 已核实 |
| 训练数据截止 | — | — | 未知 |
| 许可——代码 | github.com ↗ | 2026-05-22 | 已核实 |
| 许可——权重 | github.com ↗ | 2026-05-22 | 已核实 |
| 支持的推理后端 | github.com ↗ | 2026-05-22 | 已核实 |
| 后继版本 | — | — | 已核实 |
| MMLU (EM, Chat) | github.com ↗ | 2026-05-22 | 待核实 |
| HumanEval-Mul (Pass@1, Chat) | github.com ↗ | 2026-05-22 | 待核实 |
| MATH-500 (EM, Chat) | github.com ↗ | 2026-05-22 | 待核实 |
| GSM8K (8-shot EM, Base) | github.com ↗ | 2026-05-22 | 待核实 |
| GPQA-Diamond (Pass@1, Chat) | github.com ↗ | 2026-05-22 | 待核实 |
| LiveCodeBench (Pass@1-COT) | github.com ↗ | 2026-05-22 | 待核实 |
| AIME 2024 (Pass@1) | github.com ↗ | 2026-05-22 | 待核实 |
| GPT-5 comparison (qualitative) | arxiv.org ↗ | 2026-05-22 | 待核实 |
| DeepSeek 发布 V3.2 技术报告:与 V3.2-Exp 同架构,扩大后训练后整体对标 GPT-5 | arxiv.org/abs/2512.02556 ↗ | 2026-05-22 | 已核实 |
| DeepSeek 发布 V3.2-Exp:首次引入稀疏注意力(DSA),API 价格下降超 50% | api-docs.deepseek.com ↗ | 2026-05-22 | 已核实 |
| V3.2 和 V3.2-Exp 有什么区别? | arxiv.org ↗ | 2026-05-22 | 待核实 |
| 什么是 DeepSeek Sparse Attention(DSA)? | arxiv.org ↗ | 2026-05-22 | 待核实 |
| DeepSeek V3.2 可以自托管吗? | github.com ↗ | 2026-05-22 | 待核实 |