DeepSeek 弃用 deepseek-chat 和 deepseek-reasoner:V4 模型重命名对路由团队意味着什么

DeepSeek 将于 2026 年 7 月 24 日弃用原有模型名称。使用 deepseek-chat 或 deepseek-reasoner 的团队须将路由配置迁移至 deepseek-v4-flash 或 deepseek-v4-pro——新增的 Anthropic 兼容端点也改变了 Claude Code 用户接入 DeepSeek 的方式。

TheRouter Newsroom来源 DeepSeek
DeepSeek V4 API 模型迁移:弃用时间线、双 SDK 端点与路由影响

当主流 API 提供商宣布退役某个模型名称时,所有在路由配置、fallback 链或 SDK 调用中硬编码了该名称的团队,都需要在截止日期前完成迁移。DeepSeek 已确认:deepseek-chatdeepseek-reasoner 将于 2026 年 7 月 24 日 停止服务,替代模型带来了更丰富的功能集、分级定价体系,以及——首次发布的——Anthropic 兼容 SDK 端点。

发生了什么

DeepSeek 现行模型体系如下:

| 旧名称 | 弃用日期 | 新名称 | 模式 | |---|---|---|---| | deepseek-chat | 2026/07/24 | deepseek-v4-flash | 非思考模式(默认) | | deepseek-reasoner | 2026/07/24 | deepseek-v4-flash(开启思考模式) | 思考模式启用 | | — | — | deepseek-v4-pro | 双模式,1M 上下文 |

两个新模型均默认开启思考模式,这对延迟和成本预算有直接影响。目前使用 deepseek-chat 并期望获得快速非思考响应的团队,在迁移到 deepseek-v4-flash 时需要显式禁用思考模式。

新增两个 API 基础 URL 选项:

  • OpenAI 格式https://api.deepseek.com(原有)
  • Anthropic 格式https://api.deepseek.com/anthropic(新增)

Anthropic 格式端点意味着使用 Anthropic Messages API 的工具——Claude Code、OpenCode,或任何 Anthropic SDK 客户端——现在可以无需中间件转换层,直接路由至 DeepSeek V4。

对 AI 工程团队的影响

截止日期风险是真实存在的。 7 月 24 日距今不足 65 天。任何路由配置、provider preset、环境变量或 CI 流水线中硬编码的 deepseek-chatdeepseek-reasoner,若未更新,届时将直接报错。

思考模式默认值变化是行为变更。 deepseek-v4-flash 默认开启思考模式,而旧版 deepseek-chat 默认关闭。仅做模型名称替换而不调整 thinking 参数,将在生产环境中悄然改变响应延迟、token 消耗和计费输出。有严格延迟 SLA 或 token 预算控制的团队,需要显式添加 "thinking": {"type": "disabled"}——或者认真评估是否确实需要开启思考模式(对编程和推理任务而言,开启往往是更好的选择)。

两档定价,同一截止日期。 deepseek-v4-flash 输入价格为 $0.14/M tokens(缓存未命中),输出 $0.28/M tokens——与旧版 deepseek-chat 接近。deepseek-v4-pro 标准价为输入 $1.74/M、输出 $3.48/M,但目前享有 75% 折扣,有效期至 2026 年 5 月 31 日(折后输入 $0.435/M、输出 $0.87/M)。评估 deepseek-v4-pro 用于重度推理工作负载的团队,只有极短的窗口期可在折扣价下运行成本基准测试。

Anthropic 端点打通 Claude Code 路由。 新增的 https://api.deepseek.com/anthropic 端点提供 Anthropic Messages API 兼容接口。Claude Code 和 OpenCode 可通过设置 ANTHROPIC_BASE_URLANTHROPIC_AUTH_TOKEN 将 DeepSeek 作为后端模型——无需 OpenAI 格式代理层。官方推荐配置将 Opus/Sonnet 映射至 deepseek-v4-pro[1m](复杂任务使用完整 1M 上下文),Haiku/子 Agent 映射至 deepseek-v4-flash(快速执行)。这是 DeepSeek 首次提供正式的 Anthropic SDK 兼容方案。

路由/运营视角分析

对于通过 AI 网关路由或管理多上游 provider 的团队,V4 重命名带来三个决策节点:

1. 模型别名审计。 所有将 deepseek-chat 解析到 DeepSeek API 的路由器,都需要将模型字符串更新为 deepseek-v4-flash,或在路由层维护别名映射。旧名称在 7 月 24 日前仍可解析——此后将产生 400 错误或静默失败(取决于 provider 错误处理策略)。

2. 思考模式参数管控。 即使路由器正确透传了模型名称,思考模式默认值的变化也会引入隐性 breaking change。若网关不主动注入或剥离 thinking 参数,可能在未变更任何配置的情况下悄然改变生产行为。最安全的迁移方式:在路由器的 DeepSeek provider 配置中显式设置 "thinking": {"type": "enabled"}"disabled"},而非依赖默认值。

3. 双端点架构选择。 使用 Claude Code 或 Anthropic SDK 客户端的团队现在面临选择:通过 OpenAI 格式网关路由(网关处理 Anthropic→OpenAI 转换),或直接指向 DeepSeek 的 Anthropic 端点。直接接入减少一次转换跳转,并保留 reasoning_effort 等 Anthropic 专有参数;网关接入则将所有 provider 统一在一张路由表和用量账本中管理。

7 月 24 日前路由迁移检查清单:

  • [ ] 审计所有 provider 配置、环境变量和 preset 中的 deepseek-chat / deepseek-reasoner
  • [ ] 替换为 deepseek-v4-flash(快速/经济)或 deepseek-v4-pro(复杂推理/1M 上下文)
  • [ ] 添加显式 thinking 参数,避免默认行为变更
  • [ ] 更新显式命名 DeepSeek 模型的 fallback 链
  • [ ] 决策:Claude Code 工作负载使用 OpenAI 格式网关还是直连 Anthropic 端点
  • [ ] 在 5 月 31 日折扣到期前完成 deepseek-v4-pro 成本基准测试

TheRouter 用户建议

如果你通过 TheRouter 作为 OpenAI 兼容路由网关,DeepSeek V4 迁移本质上是一次 provider 配置更新:在 provider 设置中将 deepseek-chat 替换为 deepseek-v4-flashdeepseek-v4-pro,并添加显式的思考模式参数。

对于目前通过 TheRouter 路由 Claude Code 或 OpenCode 的用户,存在两条路径:继续使用 TheRouter 的 OpenAI 格式路由(将请求转发至 DeepSeek 的 OpenAI 端点),或尝试将 ANTHROPIC_BASE_URL 直接指向 https://api.deepseek.com/anthropic 建立直连 Anthropic 格式连接。直连方式无需代理,但会失去集中式路由、计费对账和 fallback 能力。

配置中国 AI provider 通过 TheRouter 路由层接入的模式,可参考 SiliconFlow provider 指南——相同的配置范式同样适用于 DeepSeek。

客服支持