Назад к моделям
DeepSeek V3.2
deepseekdeepseek/deepseek-v3.2
Характеристики
| Дата релиза (V3.2 полная) | 2025-12-02 (тех. отчёт на arXiv)arxiv.org ↗ | проверено |
| Релиз V3.2-Exp | Сентябрь 2025 (эксперимент, дебют DSA)api-docs.deepseek.com ↗ | проверено |
| Архитектура | MoE 671B / активных 37B; MLA (Multi-Head Latent Attention) + DSA (DeepSeek Sparse Attention); RoPE; цель обучения с предсказанием нескольких токеновarxiv.org ↗ | проверено |
| Токены претрейна (бэкбон V3) | 14,8 триллионаgithub.com ↗ | проверено |
| Дата отсечения данных | Не раскрыто | неизвестно |
Бенчмарки
| Benchmark | Distribution | Score | Source |
|---|---|---|---|
MMLU (EM, Chat) Из README V3 — бенчмарки V3.2 сообщаются на уровне V3.1-Terminus, поэтому базовая цифра V3 остаётся в пределах шума. | 88.5 | github.com ↗ | |
HumanEval-Mul (Pass@1, Chat) | 82.6 | github.com ↗ | |
MATH-500 (EM, Chat) | 90.2 | github.com ↗ | |
GSM8K (8-shot EM, Base) | 89.3 | github.com ↗ | |
GPQA-Diamond (Pass@1, Chat) | 59.1 | github.com ↗ | |
LiveCodeBench (Pass@1-COT) | 40.5 | github.com ↗ | |
AIME 2024 (Pass@1) | 39.2 | github.com ↗ | |
GPT-5 comparison (qualitative) Из тех. отчёта V3.2: с масштабированным post-training V3.2 сопоставим с GPT-5; высокопроизводительная вариация Speciale превосходит GPT-5 в reasoning и взяла золото на IMO / IOI / ICPC / CMO 2025. | Comparable to GPT-5; Speciale variant exceeds GPT-5 | arxiv.org ↗ |
Реестр фактов — каждая утверждаемая величина имеет источник
| источник | URL | получено | |
|---|---|---|---|
| Дата релиза (V3.2 полная) | arxiv.org ↗ | 2026-05-22 | проверено |
| Релиз V3.2-Exp | api-docs.deepseek.com ↗ | 2026-05-22 | проверено |
| Архитектура | arxiv.org ↗ | 2026-05-22 | проверено |
| Токены претрейна (бэкбон V3) | github.com ↗ | 2026-05-22 | проверено |
| Дата отсечения данных | — | — | неизвестно |
| Лицензия — код | github.com ↗ | 2026-05-22 | проверено |
| Лицензия — веса | github.com ↗ | 2026-05-22 | проверено |
| Поддерживаемые backend инференса | github.com ↗ | 2026-05-22 | проверено |
| Преемник | — | — | проверено |
| MMLU (EM, Chat) | github.com ↗ | 2026-05-22 | к проверке |
| HumanEval-Mul (Pass@1, Chat) | github.com ↗ | 2026-05-22 | к проверке |
| MATH-500 (EM, Chat) | github.com ↗ | 2026-05-22 | к проверке |
| GSM8K (8-shot EM, Base) | github.com ↗ | 2026-05-22 | к проверке |
| GPQA-Diamond (Pass@1, Chat) | github.com ↗ | 2026-05-22 | к проверке |
| LiveCodeBench (Pass@1-COT) | github.com ↗ | 2026-05-22 | к проверке |
| AIME 2024 (Pass@1) | github.com ↗ | 2026-05-22 | к проверке |
| GPT-5 comparison (qualitative) | arxiv.org ↗ | 2026-05-22 | к проверке |
| DeepSeek публикует тех. отчёт V3.2 — та же архитектура DSA, что и в V3.2-Exp, масштабированный post-training выводит её на уровень GPT-5 | arxiv.org/abs/2512.02556 ↗ | 2026-05-22 | проверено |
| DeepSeek запускает V3.2-Exp — дебют sparse attention (DSA), цена API падает более чем на 50% | api-docs.deepseek.com ↗ | 2026-05-22 | проверено |
| Чем V3.2 отличается от V3.2-Exp? | arxiv.org ↗ | 2026-05-22 | к проверке |
| Что такое DeepSeek Sparse Attention (DSA)? | arxiv.org ↗ | 2026-05-22 | к проверке |
| Можно ли запускать DeepSeek V3.2 на своём железе? | github.com ↗ | 2026-05-22 | к проверке |