QwQ Plus

qwenqwen/qwq-plus

面向推理的 Qwen — 每次响应都返回完整 thinking 轨迹。

qwq-plus 是 Qwen 系列的推理优先模型。与对话调优的模型不同，它始终运行在 thinking 模式，并在最终答案旁返回 `reasoning_content` 轨迹 — 适合需要审计或检视模型推理过程的场景。

适用于推理质量是决定性因素的问题：数学、多步规划、复杂工具选择以及结构化分析任务。TheRouter 按请求在 bailian-cn 与 bailian-sg 之间选择更便宜的一侧；`reasoning_content` 原样透传。

常开 thinking

每次响应都返回 `reasoning_content` — 无需 `enable_thinking` 开关。

推理专项

针对数学、逻辑、规划与多步工具选择调优，并非闲聊。

128K 上下文

足以容纳完整问题陈述、历史推理轨迹与工具结果。

双区域路由

Selector 按请求基于成本选择 bailian-cn 或 bailian-sg。

适合使用

数学问题、多步规划、便于审计的推理、复杂工具选择以及推理轨迹本身有价值的分析任务。

不适合使用

延迟敏感的对话、自动补全或用户并不受益于 thinking 轨迹的 UX — 改用关闭 thinking 的 qwen-plus，或 qwen-turbo / qwen-flash。

计费方式：$1.00 输入 / $3.00 输出 per MTok。`reasoning_content` token 计入输出计费。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。

上下文长度

131K

最大输出

33K

输入价格每百万 tokens

$1.20每百万 Tokens

输出价格每百万 tokens

$3.60每百万 Tokens

模态能力

文本→文本

价格明细

类型	费率
输入	$1.20 每百万 Tokens
输出	$3.60 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolsresponse_formatreasoningstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai；旧中国加速端点已下线。

cURL

curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwq-plus",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'