返回模型列表
Qwen Max
qwenqwen/qwen-max
上一代 Qwen 旗舰 — 推理与工具调用依然扎实。
qwen-max 是 Qwen 系列的上一代旗舰模型。即便 Qwen3 上线后,它在推理密集型对话、结构化输出与 function calling 工作负载中仍是稳妥选择,128K context window 足以应对长文档场景。
适合在需要旗舰行为、希望价格稳定可预测、且不需要 Qwen3 级别编码能力或 qwen3-max 的 256K 上下文时使用。TheRouter 会按请求在 bailian-cn 与 bailian-sg 之间选择更便宜的一侧。
扎实的推理
上一代 Qwen 旗舰 — 稳健的 chain-of-thought、数学与多步工具使用表现。
128K 上下文
长文档分析、大型代码评审与较长的 agent 历史都可在单次调用中完成。
Function calling
原生 tool / function calling,使用 OpenAI 兼容 schema — 无需包装 SDK。
双区域路由
Selector 按请求基于成本选择 bailian-cn 或 bailian-sg — failover 自动完成。
适合使用
推理、结构化输出与工具调用工作负载,希望使用旗舰档 Qwen 且 qwen3-max 的溢价不划算时。
不适合使用
需要 Qwen 系列最强的编码能力或 256K 上下文时,请升级到 qwen3-max;高并发低成本对话场景请降级到 qwen-plus / qwen-turbo。
计费方式:$2.00 输入 / $8.00 输出 per MTok。TheRouter 按请求选择 bailian-cn / bailian-sg 中更便宜的一侧。
上下文长度
131K
最大输出
33K
输入价格每百万 tokens
$2.40每百万 Tokens
输出价格每百万 tokens
$9.60每百万 Tokens
模态能力
文本→文本
价格明细
| 类型 | 费率 |
|---|---|
| 输入 | $2.40 每百万 Tokens |
| 输出 | $9.60 每百万 Tokens |
支持参数
temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop
API 使用示例
所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。
cURL
curl https://api.therouter.ai/v1/chat/completions -H "Content-Type: application/json" -H "Authorization: Bearer $THE_ROUTER_API_KEY" -d '{
"model": "qwen/qwen-max",
"messages": [
{"role": "user", "content": "Summarize the key points from this input."}
]
}'