DeepSeek 发布 V3.2 技术报告:与 V3.2-Exp 同架构,扩大后训练后整体对标 GPT-5
DeepSeek 在 arXiv 2512.02556 发布完整 V3.2。论文确认 V3.2 与 9 月的 V3.2-Exp 架构完全一致,区别在于后训练算力——足以让 V3.2 在所报告基准上达到 GPT-5 同档水平。另发布 Speciale 变体,在推理上超过 GPT-5,并在 2025 年 IMO / IOI / ICPC / CMO 取得金牌级成绩;但它不支持工具调用、token 用量更高,更像研究目标,不是通用路由对象。