Qwen Max

qwenqwen/qwen-max

上一代 Qwen 旗舰 — 推理与工具调用依然扎实。

qwen-max 是 Qwen 系列的上一代旗舰模型。即便 Qwen3 上线后，它在推理密集型对话、结构化输出与 function calling 工作负载中仍是稳妥选择，128K context window 足以应对长文档场景。

适合在需要旗舰行为、希望价格稳定可预测、且不需要 Qwen3 级别编码能力或 qwen3-max 的 256K 上下文时使用。TheRouter 会按请求在 bailian-cn 与 bailian-sg 之间选择更便宜的一侧。

扎实的推理

上一代 Qwen 旗舰 — 稳健的 chain-of-thought、数学与多步工具使用表现。

128K 上下文

长文档分析、大型代码评审与较长的 agent 历史都可在单次调用中完成。

Function calling

原生 tool / function calling，使用 OpenAI 兼容 schema — 无需包装 SDK。

双区域路由

Selector 按请求基于成本选择 bailian-cn 或 bailian-sg — failover 自动完成。

适合使用

推理、结构化输出与工具调用工作负载，希望使用旗舰档 Qwen 且 qwen3-max 的溢价不划算时。

不适合使用

需要 Qwen 系列最强的编码能力或 256K 上下文时，请升级到 qwen3-max；高并发低成本对话场景请降级到 qwen-plus / qwen-turbo。

计费方式：$2.00 输入 / $8.00 输出 per MTok。TheRouter 按请求选择 bailian-cn / bailian-sg 中更便宜的一侧。

上下文长度

131K

最大输出

33K

输入价格每百万 tokens

$2.40每百万 Tokens

输出价格每百万 tokens

$9.60每百万 Tokens

模态能力

文本→文本

价格明细

类型	费率
输入	$2.40 每百万 Tokens
输出	$9.60 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai；旧中国加速端点已下线。

cURL

curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen-max",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'