返回模型列表

DeepSeek V3.2

deepseekdeepseek/deepseek-v3.2

API 使用指南

Chat 调用

通过 TheRouter 的 OpenAI 兼容接口做标准对话。TheRouter 在上游统一处理 tool-calling 与 response_format,客户端代码可在 DeepSeek、Anthropic、OpenAI 之间保持可移植。

cURL
curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THEROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-v3.2",
    "messages": [{"role": "user", "content": "Prove that the sum of two odd integers is even."}]
  }'

流式输出

为聊天界面做流式输出。DSA 不影响流式语义——首 token 延迟与 V3.1-Terminus 相当,在长 prompt 上显著低于密集注意力基线。

cURL
curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THEROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-v3.2",
    "stream": true,
    "messages": [{"role": "user", "content": "Explain MoE load balancing in 200 words."}]
  }'

工具调用

DeepSeek V3.2 支持 OpenAI 形态的 function calling 与 tool_choice。当旗舰定价不合算时,可作为工具型 agent 的主力模型。

cURL
curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THEROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-v3.2",
    "messages": [{"role": "user", "content": "What is the AWS S3 region for ap-northeast-1?"}],
    "tools": [{
      "type": "function",
      "function": {
        "name": "lookup_region",
        "parameters": {"type": "object", "properties": {"code": {"type": "string"}}}
      }
    }]
  }'

结构化 JSON 输出

通过 response_format 强制 JSON 输出。高风险抽取场景下,建议同时在 system prompt 中给出 schema——V3.2 对显式结构约定的遵守度很稳定。

cURL
curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THEROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-v3.2",
    "response_format": {"type": "json_object"},
    "messages": [
      {"role": "system", "content": "Return JSON: {\"action\":string,\"args\":object}"},
      {"role": "user", "content": "Restart the nginx container on host web-03."}
    ]
  }'

自托管

V3.2 权重可在 DeepSeek Model License(允许商用)下下载。参考推理配方覆盖 SGLang、vLLM、LMDeploy、TensorRT-LLM、LightLLM、DeepSeek-Infer,FP8 与 BF16 均支持。SGLang 同时支持 AMD GPU;通过 MindIE 可在华为昇腾 NPU 上运行。下方是模型卡里给出的 SGLang 标准启动命令。

cURL
# Reference SGLang launch (FP8). See HF model card for exact tensor-parallel sizing.
python -m sglang.launch_server \
  --model deepseek-ai/DeepSeek-V3.2 \
  --tp 8 \
  --trust-remote-code \
  --port 30000

# Then call it through TheRouter as model="deepseek/deepseek-v3.2"
# with TheRouter configured to use your self-hosted endpoint as the upstream.
事实档案 — 本页每条断言可在此回溯来源
来源URL采集于
发布日期(V3.2 正式版)arxiv.org2026-05-22已核实
V3.2-Exp 发布api-docs.deepseek.com2026-05-22已核实
架构arxiv.org2026-05-22已核实
预训练 token 量(V3 主干)github.com2026-05-22已核实
训练数据截止未知
许可——代码github.com2026-05-22已核实
许可——权重github.com2026-05-22已核实
支持的推理后端github.com2026-05-22已核实
后继版本已核实
MMLU (EM, Chat)github.com2026-05-22待核实
HumanEval-Mul (Pass@1, Chat)github.com2026-05-22待核实
MATH-500 (EM, Chat)github.com2026-05-22待核实
GSM8K (8-shot EM, Base)github.com2026-05-22待核实
GPQA-Diamond (Pass@1, Chat)github.com2026-05-22待核实
LiveCodeBench (Pass@1-COT)github.com2026-05-22待核实
AIME 2024 (Pass@1)github.com2026-05-22待核实
GPT-5 comparison (qualitative)arxiv.org2026-05-22待核实
DeepSeek 发布 V3.2 技术报告:与 V3.2-Exp 同架构,扩大后训练后整体对标 GPT-5arxiv.org/abs/2512.025562026-05-22已核实
DeepSeek 发布 V3.2-Exp:首次引入稀疏注意力(DSA),API 价格下降超 50%api-docs.deepseek.com2026-05-22已核实
V3.2 和 V3.2-Exp 有什么区别?arxiv.org2026-05-22待核实
什么是 DeepSeek Sparse Attention(DSA)?arxiv.org2026-05-22待核实
DeepSeek V3.2 可以自托管吗?github.com2026-05-22待核实
客服支持