返回模型列表

Qwen3 Max

qwenqwen/qwen3-max

Qwen3 旗舰 — 阿里巴巴最强推理与编码模型。

qwen3-max 是阿里巴巴 Qwen3 代的商用旗舰模型。在推理、编码、数学与复杂工具调用方面领先整个 Qwen 系列,配合 256K context window,可一次性处理仓库级代码、长文档与多轮 agent 交互轨迹。

TheRouter 同时部署在大陆(bailian-cn)与新加坡(bailian-sg)两个 Bailian endpoint。Selector 按请求选择更便宜的区域,让你获得厂商直连的延迟,无需手动指定区域。

深度推理
Qwen 系列内最强的推理、数学与工具使用评分,适合 chain-of-thought 密集型提示。
256K 上下文
单请求可容纳小型仓库或多份长 PDF — 无需复杂的分块策略。
双区域路由
按请求自动在 bailian-cn 与 bailian-sg 之间挑选更便宜的一侧 — 客户端无需任何区域逻辑。
OpenAI 兼容
标准 `/v1/chat/completions` 形态,支持 tools、JSON mode 与 streaming。
适合使用
高价值推理、复杂编码、仓库级重构以及对 Qwen 系列质量敏感、预算允许走旗舰档位的 agent 工作流。
不适合使用
高并发客服、简单改写或延迟敏感的自动补全 — 降级到 qwen-plus 或 qwen-turbo 可节省 10–20 倍成本。
计费方式:$1.50 输入 / $7.50 输出 per MTok。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。
上下文长度
262K
最大输出
33K
输入价格每百万 tokens
$1.80每百万 Tokens
输出价格每百万 tokens
$9.00每百万 Tokens

模态能力

文本文本

价格明细

类型费率
输入$1.80 每百万 Tokens
输出$9.00 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。

cURL
curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen3-max",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'
客服支持