返回模型列表
QwQ Plus
qwenqwen/qwq-plus
面向推理的 Qwen — 每次响应都返回完整 thinking 轨迹。
qwq-plus 是 Qwen 系列的推理优先模型。与对话调优的模型不同,它始终运行在 thinking 模式,并在最终答案旁返回 `reasoning_content` 轨迹 — 适合需要审计或检视模型推理过程的场景。
适用于推理质量是决定性因素的问题:数学、多步规划、复杂工具选择以及结构化分析任务。TheRouter 按请求在 bailian-cn 与 bailian-sg 之间选择更便宜的一侧;`reasoning_content` 原样透传。
常开 thinking
每次响应都返回 `reasoning_content` — 无需 `enable_thinking` 开关。
推理专项
针对数学、逻辑、规划与多步工具选择调优,并非闲聊。
128K 上下文
足以容纳完整问题陈述、历史推理轨迹与工具结果。
双区域路由
Selector 按请求基于成本选择 bailian-cn 或 bailian-sg。
适合使用
数学问题、多步规划、便于审计的推理、复杂工具选择以及推理轨迹本身有价值的分析任务。
不适合使用
延迟敏感的对话、自动补全或用户并不受益于 thinking 轨迹的 UX — 改用关闭 thinking 的 qwen-plus,或 qwen-turbo / qwen-flash。
计费方式:$1.00 输入 / $3.00 输出 per MTok。`reasoning_content` token 计入输出计费。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。
上下文长度
131K
最大输出
33K
输入价格每百万 tokens
$1.20每百万 Tokens
输出价格每百万 tokens
$3.60每百万 Tokens
模态能力
文本→文本
价格明细
| 类型 | 费率 |
|---|---|
| 输入 | $1.20 每百万 Tokens |
| 输出 | $3.60 每百万 Tokens |
支持参数
temperaturemax_tokenstop_ptoolsresponse_formatreasoningstop
API 使用示例
所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。
cURL
curl https://api.therouter.ai/v1/chat/completions -H "Content-Type: application/json" -H "Authorization: Bearer $THE_ROUTER_API_KEY" -d '{
"model": "qwen/qwq-plus",
"messages": [
{"role": "user", "content": "Summarize the key points from this input."}
]
}'