DeepSeek 弃用 deepseek-chat 和 deepseek-reasoner：V4 模型重命名对路由团队意味着什么

当主流 API 提供商宣布退役某个模型名称时，所有在路由配置、fallback 链或 SDK 调用中硬编码了该名称的团队，都需要在截止日期前完成迁移。DeepSeek 已确认：deepseek-chat 和 deepseek-reasoner 将于 2026 年 7 月 24 日 停止服务，替代模型带来了更丰富的功能集、分级定价体系，以及——首次发布的——Anthropic 兼容 SDK 端点。

发生了什么

DeepSeek 现行模型体系如下：

| 旧名称 | 弃用日期 | 新名称 | 模式 | |---|---|---|---| | deepseek-chat | 2026/07/24 | deepseek-v4-flash | 非思考模式（默认） | | deepseek-reasoner | 2026/07/24 | deepseek-v4-flash（开启思考模式） | 思考模式启用 | | — | — | deepseek-v4-pro | 双模式，1M 上下文 |

两个新模型均默认开启思考模式，这对延迟和成本预算有直接影响。目前使用 deepseek-chat 并期望获得快速非思考响应的团队，在迁移到 deepseek-v4-flash 时需要显式禁用思考模式。

新增两个 API 基础 URL 选项：

OpenAI 格式：https://api.deepseek.com（原有）
Anthropic 格式：https://api.deepseek.com/anthropic（新增）

Anthropic 格式端点意味着使用 Anthropic Messages API 的工具——Claude Code、OpenCode，或任何 Anthropic SDK 客户端——现在可以无需中间件转换层，直接路由至 DeepSeek V4。

对 AI 工程团队的影响

截止日期风险是真实存在的。 7 月 24 日距今不足 65 天。任何路由配置、provider preset、环境变量或 CI 流水线中硬编码的 deepseek-chat 或 deepseek-reasoner，若未更新，届时将直接报错。

思考模式默认值变化是行为变更。 deepseek-v4-flash 默认开启思考模式，而旧版 deepseek-chat 默认关闭。仅做模型名称替换而不调整 thinking 参数，将在生产环境中悄然改变响应延迟、token 消耗和计费输出。有严格延迟 SLA 或 token 预算控制的团队，需要显式添加 "thinking": {"type": "disabled"}——或者认真评估是否确实需要开启思考模式（对编程和推理任务而言，开启往往是更好的选择）。

两档定价，同一截止日期。 deepseek-v4-flash 输入价格为 $0.14/M tokens（缓存未命中），输出 $0.28/M tokens——与旧版 deepseek-chat 接近。deepseek-v4-pro 标准价为输入 $1.74/M、输出 $3.48/M，但目前享有 75% 折扣，有效期至 2026 年 5 月 31 日（折后输入 $0.435/M、输出 $0.87/M）。评估 deepseek-v4-pro 用于重度推理工作负载的团队，只有极短的窗口期可在折扣价下运行成本基准测试。

Anthropic 端点打通 Claude Code 路由。 新增的 https://api.deepseek.com/anthropic 端点提供 Anthropic Messages API 兼容接口。Claude Code 和 OpenCode 可通过设置 ANTHROPIC_BASE_URL 和 ANTHROPIC_AUTH_TOKEN 将 DeepSeek 作为后端模型——无需 OpenAI 格式代理层。官方推荐配置将 Opus/Sonnet 映射至 deepseek-v4-pro[1m]（复杂任务使用完整 1M 上下文），Haiku/子 Agent 映射至 deepseek-v4-flash（快速执行）。这是 DeepSeek 首次提供正式的 Anthropic SDK 兼容方案。

路由/运营视角分析

对于通过 AI 网关路由或管理多上游 provider 的团队，V4 重命名带来三个决策节点：

1. 模型别名审计。 所有将 deepseek-chat 解析到 DeepSeek API 的路由器，都需要将模型字符串更新为 deepseek-v4-flash，或在路由层维护别名映射。旧名称在 7 月 24 日前仍可解析——此后将产生 400 错误或静默失败（取决于 provider 错误处理策略）。

2. 思考模式参数管控。 即使路由器正确透传了模型名称，思考模式默认值的变化也会引入隐性 breaking change。若网关不主动注入或剥离 thinking 参数，可能在未变更任何配置的情况下悄然改变生产行为。最安全的迁移方式：在路由器的 DeepSeek provider 配置中显式设置 "thinking": {"type": "enabled"} 或 "disabled"}，而非依赖默认值。

3. 双端点架构选择。 使用 Claude Code 或 Anthropic SDK 客户端的团队现在面临选择：通过 OpenAI 格式网关路由（网关处理 Anthropic→OpenAI 转换），或直接指向 DeepSeek 的 Anthropic 端点。直接接入减少一次转换跳转，并保留 reasoning_effort 等 Anthropic 专有参数；网关接入则将所有 provider 统一在一张路由表和用量账本中管理。

7 月 24 日前路由迁移检查清单：

[ ] 审计所有 provider 配置、环境变量和 preset 中的 deepseek-chat / deepseek-reasoner
[ ] 替换为 deepseek-v4-flash（快速/经济）或 deepseek-v4-pro（复杂推理/1M 上下文）
[ ] 添加显式 thinking 参数，避免默认行为变更
[ ] 更新显式命名 DeepSeek 模型的 fallback 链
[ ] 决策：Claude Code 工作负载使用 OpenAI 格式网关还是直连 Anthropic 端点
[ ] 在 5 月 31 日折扣到期前完成 deepseek-v4-pro 成本基准测试

TheRouter 用户建议

如果你通过 TheRouter 作为 OpenAI 兼容路由网关，DeepSeek V4 迁移本质上是一次 provider 配置更新：在 provider 设置中将 deepseek-chat 替换为 deepseek-v4-flash 或 deepseek-v4-pro，并添加显式的思考模式参数。

对于目前通过 TheRouter 路由 Claude Code 或 OpenCode 的用户，存在两条路径：继续使用 TheRouter 的 OpenAI 格式路由（将请求转发至 DeepSeek 的 OpenAI 端点），或尝试将 ANTHROPIC_BASE_URL 直接指向 https://api.deepseek.com/anthropic 建立直连 Anthropic 格式连接。直连方式无需代理，但会失去集中式路由、计费对账和 fallback 能力。

配置中国 AI provider 通过 TheRouter 路由层接入的模式，可参考 SiliconFlow provider 指南——相同的配置范式同样适用于 DeepSeek。

发生了什么

对 AI 工程团队的影响

路由/运营视角分析

TheRouter 用户建议

相关阅读

DeepSeek 正式支持 Anthropic API 格式：新双协议端点对路由层意味着什么

DeepSeek 官方编程智能体指南：将 Claude Code 和 OpenCode 路由到 V4 模型

Qwen-Image 上线 DashScope：新图像生成与编辑 API 对异步媒体路由的影响