Назад к моделям

DeepSeek V3.2

deepseekdeepseek/deepseek-v3.2

Гид по API

Chat completion

Стандартный chat через OpenAI-совместимую поверхность TheRouter. TheRouter нормализует tool-calling и response_format поверх провайдера — клиентский код остаётся переносимым между DeepSeek, Anthropic и OpenAI.

cURL
curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THEROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-v3.2",
    "messages": [{"role": "user", "content": "Prove that the sum of two odd integers is even."}]
  }'

Стриминг

Стримит токены для чат-UI. DSA не меняет семантику стриминга — задержка первого токена сопоставима с V3.1-Terminus и существенно ниже, чем у dense-attention базелайнов на длинных подсказках.

cURL
curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THEROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-v3.2",
    "stream": true,
    "messages": [{"role": "user", "content": "Explain MoE load balancing in 200 words."}]
  }'

Использование инструментов

DeepSeek V3.2 поддерживает function calling и tool_choice в формате OpenAI. Используйте как «рабочую лошадку» для агентов с инструментами, когда флагманская цена не оправдана.

cURL
curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THEROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-v3.2",
    "messages": [{"role": "user", "content": "What is the AWS S3 region for ap-northeast-1?"}],
    "tools": [{
      "type": "function",
      "function": {
        "name": "lookup_region",
        "parameters": {"type": "object", "properties": {"code": {"type": "string"}}}
      }
    }]
  }'

Структурированный JSON

Через response_format ограничьте вывод JSON. Для критичного извлечения добавьте схему в system prompt — V3.2 надёжно следует явному контракту формы.

cURL
curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THEROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-v3.2",
    "response_format": {"type": "json_object"},
    "messages": [
      {"role": "system", "content": "Return JSON: {\"action\":string,\"args\":object}"},
      {"role": "user", "content": "Restart the nginx container on host web-03."}
    ]
  }'

Self-host

Веса V3.2 можно скачать по DeepSeek Model License (коммерческое использование разрешено). Эталонные рецепты инференса есть для SGLang, vLLM, LMDeploy, TensorRT-LLM, LightLLM и DeepSeek-Infer в FP8 и BF16. SGLang работает и на AMD GPU; Huawei Ascend NPU поддерживается через MindIE. Ниже — каноническая команда запуска SGLang из карточки модели.

cURL
# Reference SGLang launch (FP8). See HF model card for exact tensor-parallel sizing.
python -m sglang.launch_server \
  --model deepseek-ai/DeepSeek-V3.2 \
  --tp 8 \
  --trust-remote-code \
  --port 30000

# Then call it through TheRouter as model="deepseek/deepseek-v3.2"
# with TheRouter configured to use your self-hosted endpoint as the upstream.
Реестр фактов — каждая утверждаемая величина имеет источник
источникURLполучено
Дата релиза (V3.2 полная)arxiv.org2026-05-22проверено
Релиз V3.2-Expapi-docs.deepseek.com2026-05-22проверено
Архитектураarxiv.org2026-05-22проверено
Токены претрейна (бэкбон V3)github.com2026-05-22проверено
Дата отсечения данныхнеизвестно
Лицензия — кодgithub.com2026-05-22проверено
Лицензия — весаgithub.com2026-05-22проверено
Поддерживаемые backend инференсаgithub.com2026-05-22проверено
Преемникпроверено
MMLU (EM, Chat)github.com2026-05-22к проверке
HumanEval-Mul (Pass@1, Chat)github.com2026-05-22к проверке
MATH-500 (EM, Chat)github.com2026-05-22к проверке
GSM8K (8-shot EM, Base)github.com2026-05-22к проверке
GPQA-Diamond (Pass@1, Chat)github.com2026-05-22к проверке
LiveCodeBench (Pass@1-COT)github.com2026-05-22к проверке
AIME 2024 (Pass@1)github.com2026-05-22к проверке
GPT-5 comparison (qualitative)arxiv.org2026-05-22к проверке
DeepSeek публикует тех. отчёт V3.2 — та же архитектура DSA, что и в V3.2-Exp, масштабированный post-training выводит её на уровень GPT-5arxiv.org/abs/2512.025562026-05-22проверено
DeepSeek запускает V3.2-Exp — дебют sparse attention (DSA), цена API падает более чем на 50%api-docs.deepseek.com2026-05-22проверено
Чем V3.2 отличается от V3.2-Exp?arxiv.org2026-05-22к проверке
Что такое DeepSeek Sparse Attention (DSA)?arxiv.org2026-05-22к проверке
Можно ли запускать DeepSeek V3.2 на своём железе?github.com2026-05-22к проверке
Поддержка