返回模型列表
Qwen3 Max
qwenqwen/qwen3-max
Qwen3 旗舰 — 阿里巴巴最强推理与编码模型。
qwen3-max 是阿里巴巴 Qwen3 代的商用旗舰模型。在推理、编码、数学与复杂工具调用方面领先整个 Qwen 系列,配合 256K context window,可一次性处理仓库级代码、长文档与多轮 agent 交互轨迹。
TheRouter 同时部署在大陆(bailian-cn)与新加坡(bailian-sg)两个 Bailian endpoint。Selector 按请求选择更便宜的区域,让你获得厂商直连的延迟,无需手动指定区域。
深度推理
Qwen 系列内最强的推理、数学与工具使用评分,适合 chain-of-thought 密集型提示。
256K 上下文
单请求可容纳小型仓库或多份长 PDF — 无需复杂的分块策略。
双区域路由
按请求自动在 bailian-cn 与 bailian-sg 之间挑选更便宜的一侧 — 客户端无需任何区域逻辑。
OpenAI 兼容
标准 `/v1/chat/completions` 形态,支持 tools、JSON mode 与 streaming。
适合使用
高价值推理、复杂编码、仓库级重构以及对 Qwen 系列质量敏感、预算允许走旗舰档位的 agent 工作流。
不适合使用
高并发客服、简单改写或延迟敏感的自动补全 — 降级到 qwen-plus 或 qwen-turbo 可节省 10–20 倍成本。
计费方式:$1.50 输入 / $7.50 输出 per MTok。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。
上下文长度
262K
最大输出
33K
输入价格每百万 tokens
$1.80每百万 Tokens
输出价格每百万 tokens
$9.00每百万 Tokens
模态能力
文本→文本
价格明细
| 类型 | 费率 |
|---|---|
| 输入 | $1.80 每百万 Tokens |
| 输出 | $9.00 每百万 Tokens |
支持参数
temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop
API 使用示例
所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。
cURL
curl https://api.therouter.ai/v1/chat/completions -H "Content-Type: application/json" -H "Authorization: Bearer $THE_ROUTER_API_KEY" -d '{
"model": "qwen/qwen3-max",
"messages": [
{"role": "user", "content": "Summarize the key points from this input."}
]
}'