Qwen Plus

qwenqwen/qwen-plus

Qwen3 中档主力 — 支持 thinking / 非 thinking 双模式，1M 上下文。

qwen-plus 是 Qwen3 商用线的主力机型。提供两种工作模式 — 适合日常对话的快速模式（`enable_thinking: false`），以及面向更难问题、会在响应中输出 `reasoning_content` 的深度模式（`enable_thinking: true`） — 而价格只是旗舰的一小部分。

1M context window 让它成为长文档问答、多文件代码阅读与长 agent 对话的强默认值。TheRouter 按请求在 bailian-cn 与 bailian-sg 之间选择更便宜的一侧；`enable_thinking` 与 `reasoning_content` 在两端均原样透传。

thinking / 非 thinking

按请求切换 `enable_thinking`。为 true 时模型会在最终答案旁返回 `reasoning_content` 字段。

1M 上下文

Qwen 商用机型中最大的上下文窗口之一 — 适合整篇文档或多文件场景。

成本平衡

$0.50 输入 / $1.50 输出 per MTok。相对 qwen-max 输入便宜约 5 倍、输出便宜约 5.3 倍。

双区域路由

Selector 按请求选择 bailian-cn / bailian-sg 中更便宜的一侧 — 客户端无需任何区域逻辑。

适合使用

生产环境的 Qwen 默认机型：长文档问答、多步 agent、代码阅读，以及希望保留可选深度推理但不愿支付旗舰价格的对话场景。

不适合使用

需要 Qwen 系列最强推理或编码时升级到 qwen3-max / qwen3-coder-plus；高吞吐低成本对话场景请改用 qwen-turbo 或 qwen-flash。

计费方式：$0.50 输入 / $1.50 输出 per MTok。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。Thinking 模式不改变价格。

上下文长度

1.0M

最大输出

33K

输入价格每百万 tokens

$0.600每百万 Tokens

输出价格每百万 tokens

$1.80每百万 Tokens

模态能力

文本→文本

价格明细

类型	费率
输入	$0.600 每百万 Tokens
输出	$1.80 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatreasoningstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai；旧中国加速端点已下线。

cURL

curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen-plus",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'