DeepSeek V3.2

deepseekdeepseek/deepseek-v3.2

Характеристики

Дата релиза (V3.2 полная)	2025-12-02 (тех. отчёт на arXiv)arxiv.org ↗	проверено
Релиз V3.2-Exp	Сентябрь 2025 (эксперимент, дебют DSA)api-docs.deepseek.com ↗	проверено
Архитектура	MoE 671B / активных 37B; MLA (Multi-Head Latent Attention) + DSA (DeepSeek Sparse Attention); RoPE; цель обучения с предсказанием нескольких токеновarxiv.org ↗	проверено
Токены претрейна (бэкбон V3)	14,8 триллионаgithub.com ↗	проверено
Дата отсечения данных	Не раскрыто	неизвестно

Бенчмарки

Benchmark	Score	Source
MMLU (EM, Chat) Из README V3 — бенчмарки V3.2 сообщаются на уровне V3.1-Terminus, поэтому базовая цифра V3 остаётся в пределах шума.	88.5	github.com ↗
HumanEval-Mul (Pass@1, Chat)	82.6	github.com ↗
MATH-500 (EM, Chat)	90.2	github.com ↗
GSM8K (8-shot EM, Base)	89.3	github.com ↗
GPQA-Diamond (Pass@1, Chat)	59.1	github.com ↗
LiveCodeBench (Pass@1-COT)	40.5	github.com ↗
AIME 2024 (Pass@1)	39.2	github.com ↗
GPT-5 comparison (qualitative) Из тех. отчёта V3.2: с масштабированным post-training V3.2 сопоставим с GPT-5; высокопроизводительная вариация Speciale превосходит GPT-5 в reasoning и взяла золото на IMO / IOI / ICPC / CMO 2025.	Comparable to GPT-5; Speciale variant exceeds GPT-5	arxiv.org ↗

Реестр фактов — каждая утверждаемая величина имеет источник

источник	URL	получено
Дата релиза (V3.2 полная)	arxiv.org ↗	2026-05-22	проверено
Релиз V3.2-Exp	api-docs.deepseek.com ↗	2026-05-22	проверено
Архитектура	arxiv.org ↗	2026-05-22	проверено
Токены претрейна (бэкбон V3)	github.com ↗	2026-05-22	проверено
Дата отсечения данных	—	—	неизвестно
Лицензия — код	github.com ↗	2026-05-22	проверено
Лицензия — веса	github.com ↗	2026-05-22	проверено
Поддерживаемые backend инференса	github.com ↗	2026-05-22	проверено
Преемник	—	—	проверено
MMLU (EM, Chat)	github.com ↗	2026-05-22	к проверке
HumanEval-Mul (Pass@1, Chat)	github.com ↗	2026-05-22	к проверке
MATH-500 (EM, Chat)	github.com ↗	2026-05-22	к проверке
GSM8K (8-shot EM, Base)	github.com ↗	2026-05-22	к проверке
GPQA-Diamond (Pass@1, Chat)	github.com ↗	2026-05-22	к проверке
LiveCodeBench (Pass@1-COT)	github.com ↗	2026-05-22	к проверке
AIME 2024 (Pass@1)	github.com ↗	2026-05-22	к проверке
GPT-5 comparison (qualitative)	arxiv.org ↗	2026-05-22	к проверке
DeepSeek публикует тех. отчёт V3.2 — та же архитектура DSA, что и в V3.2-Exp, масштабированный post-training выводит её на уровень GPT-5	arxiv.org/abs/2512.02556 ↗	2026-05-22	проверено
DeepSeek запускает V3.2-Exp — дебют sparse attention (DSA), цена API падает более чем на 50%	api-docs.deepseek.com ↗	2026-05-22	проверено
Чем V3.2 отличается от V3.2-Exp?	arxiv.org ↗	2026-05-22	к проверке
Что такое DeepSeek Sparse Attention (DSA)?	arxiv.org ↗	2026-05-22	к проверке
Можно ли запускать DeepSeek V3.2 на своём железе?	github.com ↗	2026-05-22	к проверке