返回模型列表
Qwen Plus
qwenqwen/qwen-plus
Qwen3 中档主力 — 支持 thinking / 非 thinking 双模式,1M 上下文。
qwen-plus 是 Qwen3 商用线的主力机型。提供两种工作模式 — 适合日常对话的快速模式(`enable_thinking: false`),以及面向更难问题、会在响应中输出 `reasoning_content` 的深度模式(`enable_thinking: true`) — 而价格只是旗舰的一小部分。
1M context window 让它成为长文档问答、多文件代码阅读与长 agent 对话的强默认值。TheRouter 按请求在 bailian-cn 与 bailian-sg 之间选择更便宜的一侧;`enable_thinking` 与 `reasoning_content` 在两端均原样透传。
thinking / 非 thinking
按请求切换 `enable_thinking`。为 true 时模型会在最终答案旁返回 `reasoning_content` 字段。
1M 上下文
Qwen 商用机型中最大的上下文窗口之一 — 适合整篇文档或多文件场景。
成本平衡
$0.50 输入 / $1.50 输出 per MTok。相对 qwen-max 输入便宜约 5 倍、输出便宜约 5.3 倍。
双区域路由
Selector 按请求选择 bailian-cn / bailian-sg 中更便宜的一侧 — 客户端无需任何区域逻辑。
适合使用
生产环境的 Qwen 默认机型:长文档问答、多步 agent、代码阅读,以及希望保留可选深度推理但不愿支付旗舰价格的对话场景。
不适合使用
需要 Qwen 系列最强推理或编码时升级到 qwen3-max / qwen3-coder-plus;高吞吐低成本对话场景请改用 qwen-turbo 或 qwen-flash。
计费方式:$0.50 输入 / $1.50 输出 per MTok。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。Thinking 模式不改变价格。
上下文长度
1.0M
最大输出
33K
输入价格每百万 tokens
$0.600每百万 Tokens
输出价格每百万 tokens
$1.80每百万 Tokens
模态能力
文本→文本
价格明细
| 类型 | 费率 |
|---|---|
| 输入 | $0.600 每百万 Tokens |
| 输出 | $1.80 每百万 Tokens |
支持参数
temperaturemax_tokenstop_ptoolstool_choiceresponse_formatreasoningstop
API 使用示例
所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。
cURL
curl https://api.therouter.ai/v1/chat/completions -H "Content-Type: application/json" -H "Authorization: Bearer $THE_ROUTER_API_KEY" -d '{
"model": "qwen/qwen-plus",
"messages": [
{"role": "user", "content": "Summarize the key points from this input."}
]
}'