Qwen3 Max

qwenqwen/qwen3-max

Qwen3 旗舰 — 阿里巴巴最强推理与编码模型。

qwen3-max 是阿里巴巴 Qwen3 代的商用旗舰模型。在推理、编码、数学与复杂工具调用方面领先整个 Qwen 系列，配合 256K context window，可一次性处理仓库级代码、长文档与多轮 agent 交互轨迹。

TheRouter 同时部署在大陆（bailian-cn）与新加坡（bailian-sg）两个 Bailian endpoint。Selector 按请求选择更便宜的区域，让你获得厂商直连的延迟，无需手动指定区域。

深度推理

Qwen 系列内最强的推理、数学与工具使用评分，适合 chain-of-thought 密集型提示。

256K 上下文

单请求可容纳小型仓库或多份长 PDF — 无需复杂的分块策略。

双区域路由

按请求自动在 bailian-cn 与 bailian-sg 之间挑选更便宜的一侧 — 客户端无需任何区域逻辑。

OpenAI 兼容

标准 `/v1/chat/completions` 形态，支持 tools、JSON mode 与 streaming。

适合使用

高价值推理、复杂编码、仓库级重构以及对 Qwen 系列质量敏感、预算允许走旗舰档位的 agent 工作流。

不适合使用

高并发客服、简单改写或延迟敏感的自动补全 — 降级到 qwen-plus 或 qwen-turbo 可节省 10–20 倍成本。

计费方式：$1.50 输入 / $7.50 输出 per MTok。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。

上下文长度

262K

最大输出

33K

输入价格每百万 tokens

$1.80每百万 Tokens

输出价格每百万 tokens

$9.00每百万 Tokens

模态能力

文本→文本

价格明细

类型	费率
输入	$1.80 每百万 Tokens
输出	$9.00 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai；旧中国加速端点已下线。

cURL

curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen3-max",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'