DeepSeek 官方编程智能体指南:将 Claude Code 和 OpenCode 路由到 V4 模型

DeepSeek 发布了 Claude Code、OpenCode 和 OpenClaw 的官方集成指南,揭示了一种可用于任意 Anthropic 兼容网关的按层级路由模型配置范式。

TheRouter Newsroom来源 DeepSeek
DeepSeek V4 编程智能体集成示意图,展示 Claude Code 路由到 deepseek-v4-pro 和 deepseek-v4-flash

当一个模型提供商同时为三个主流编程智能体发布官方集成指南,这传递的不仅是教程,更是一种路由策略信号。DeepSeek 最新发布的 Integrate with AI Tools 指南涵盖了 Claude Code、OpenCode 和 OpenClaw,其中的配置示例揭示了业界正在形成的一套成熟思路:在智能体工作流内部,对不同层级任务进行差异化模型分配。

发生了什么

DeepSeek 发布了官方工程指南,说明如何将 Claude Code、OpenCode 和 OpenClaw 的后端从默认的 Anthropic/OpenAI 切换到 DeepSeek V4 模型。该指南已在 DeepSeek API 文档中上线,约发布于一周前。

其中 Claude Code 部分最具参考价值。DeepSeek 为每个模型层级做了明确的映射:

export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
export ANTHROPIC_AUTH_TOKEN=<your DeepSeek API Key>
export ANTHROPIC_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_OPUS_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_SONNET_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-flash
export CLAUDE_CODE_SUBAGENT_MODEL=deepseek-v4-flash
export CLAUDE_CODE_EFFORT_LEVEL=max

注意这里的非对称设计:Opus 和 Sonnet 层级都指向 deepseek-v4-pro[1m](百万上下文扩展版),而 Haiku 和子智能体槽位则使用 deepseek-v4-flash。这是有意为之的分层策略:重型推理任务保留在能力更强的模型上,轻量级子智能体调用走更快、更便宜的 Flash 版本。

OpenCode 的配置更简洁:在终端中执行 /connect deepseek 命令,然后选择模型即可。OpenClaw 则通过引导式 onboard --install-daemon 流程,让用户选择 DeepSeek 作为提供商并选择 deepseek-v4-prodeepseek-v4-flash

对 AI 工程团队的影响

这份指南将此前属于"圈内人才知道"的知识正式化:Claude Code 通过环境变量暴露了按层级路由的接口,任意 Anthropic 兼容的 API 端点——不只是 Anthropic 自己的——都可以接入。

对于管理多智能体工作流的团队,这直接带来以下运营影响:

  1. 无需改代码即可切换提供商。 为 Claude Code、OpenCode 或 OpenClaw 替换后端,如今是有官方文档背书的标准化模式。这降低了尝试新提供商的感知风险——退出方式就是取消环境变量设置。

  2. 层级化成本管控。 将 Haiku 和子智能体调用路由到 deepseek-v4-flash,同时让 Opus/Sonnet 保持在 deepseek-v4-pro,可在保证顶层推理质量的前提下将子智能体成本降低 80–90%。这套逻辑适用于任何可通过 Anthropic 兼容端点访问的提供商组合。

  3. [1m] 上下文修饰符是路由信号。 deepseek-v4-pro[1m] 这个字符串告诉 DeepSeek 的 Anthropic 兼容端点使用百万 token 上下文版本。该修饰符是提供商特有的——即使 API 接口兼容,每个提供商的具体行为差异仍然需要路由层面的感知处理。

  4. OpenClaw 的覆盖说明了什么。 DeepSeek 在官方文档中将 OpenClaw 与 Claude Code、OpenCode 并列,值得关注。OpenClaw 是一个面向飞书和微信的个人 AI 助手平台。它出现在 DeepSeek 的官方文档里,反映出中国 AI 基础设施提供商正在面向完整的智能体技术栈进行生态建设,而不只是面向 API 消费者。

路由层/运营商视角

DeepSeek 在文档中描述的环境变量路由模式具有可移植性——本质上这是一个网关路由问题的变体。与其在每台开发者机器上配置环境变量,不如通过路由网关集中管理同样的层级映射:

  • 将所有 claude-3-opus-* 模型 ID 路由到 deepseek-v4-pro[1m] 以实现成本套利
  • claude-3-haiku-* 或子智能体模型调用路由到 deepseek-v4-flash
  • 通过网关策略实施,而非依赖每个开发者的本地环境变量配置

对于有多位开发者使用 Claude Code 的团队,这一点尤为重要。逐机器管理环境变量既脆弱又难以审计;在网关边界做策略级路由,可审计、可回滚,切换提供商时无需重新部署客户端。

运营商考量此模式时的决策框架:

| 判断信号 | 建议行动 | |---|---| | Anthropic API 费用占 AI 预算的 30% 以上 | 优先评估将 Haiku 层级调用路由到 DeepSeek V4 | | 子智能体任务占 token 用量的大多数 | 将 CLAUDE_CODE_SUBAGENT_MODEL 路由到 Flash 层级模型 | | 团队需要可复现的提供商配置 | 在网关集中配置,而非在每个开发者本地设置 | | 智能体文档任务需要百万上下文 | 确认 [1m] 修饰符是否通过你的网关或直连 API 可用 | | 依赖 Anthropic 特有功能(提示缓存、扩展思考等) | 全量切换前务必验证功能兼容性 |

主要风险在于能力差距。环境变量方案简单,其前提假设是 V4 Pro 在质量上可替代 Opus/Sonnet。对大多数编程任务而言,这个假设成立;但对重度依赖 Anthropic 特有功能——如扩展思考、computer use、MCP 原生集成——的团队而言,应在全量路由前进行充分测试。

TheRouter 用户可以关注和尝试什么

如果你通过路由网关运行 Claude Code,本指南记录的层级映射模式正是你应该在网关层面配置的路由策略形式。与其依赖每个开发者本地的环境变量文件,不如定义一套模型别名映射,在网关处拦截 Claude Code 的模型请求,按层级重定向到你偏好的提供商。

使用支持 Anthropic 兼容路由的网关的团队,今天就可以应用这套模式:将 Anthropic 模型命名空间按层级映射到你选择的提供商,并在提供商配置中处理 [1m] 上下文修饰符。这样你就能获得集中化的成本核算、按层级的审计日志,并在提供商发生故障时快速回滚——而无需修改每位开发者的本地配置。

持续关注 DeepSeek API 文档的后续更新,尤其是提示缓存支持(目前尚未文档化)和 computer-use 工具兼容性——这两者都会影响依赖这些特性的智能体工作流。

客服支持