返回模型列表

Qwen Max

qwenqwen/qwen-max

上一代 Qwen 旗舰 — 推理与工具调用依然扎实。

qwen-max 是 Qwen 系列的上一代旗舰模型。即便 Qwen3 上线后,它在推理密集型对话、结构化输出与 function calling 工作负载中仍是稳妥选择,128K context window 足以应对长文档场景。

适合在需要旗舰行为、希望价格稳定可预测、且不需要 Qwen3 级别编码能力或 qwen3-max 的 256K 上下文时使用。TheRouter 会按请求在 bailian-cn 与 bailian-sg 之间选择更便宜的一侧。

扎实的推理
上一代 Qwen 旗舰 — 稳健的 chain-of-thought、数学与多步工具使用表现。
128K 上下文
长文档分析、大型代码评审与较长的 agent 历史都可在单次调用中完成。
Function calling
原生 tool / function calling,使用 OpenAI 兼容 schema — 无需包装 SDK。
双区域路由
Selector 按请求基于成本选择 bailian-cn 或 bailian-sg — failover 自动完成。
适合使用
推理、结构化输出与工具调用工作负载,希望使用旗舰档 Qwen 且 qwen3-max 的溢价不划算时。
不适合使用
需要 Qwen 系列最强的编码能力或 256K 上下文时,请升级到 qwen3-max;高并发低成本对话场景请降级到 qwen-plus / qwen-turbo。
计费方式:$2.00 输入 / $8.00 输出 per MTok。TheRouter 按请求选择 bailian-cn / bailian-sg 中更便宜的一侧。
上下文长度
131K
最大输出
33K
输入价格每百万 tokens
$2.40每百万 Tokens
输出价格每百万 tokens
$9.60每百万 Tokens

模态能力

文本文本

价格明细

类型费率
输入$2.40 每百万 Tokens
输出$9.60 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。

cURL
curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen-max",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'
客服支持