Qwen Long

qwenqwen/qwen-long

10M token 长上下文 Qwen — 面向文档级分析。

qwen-long 是 Qwen 家族的长上下文专项模型。10M token 的上下文窗口可一次性吞入整本书、数百页的法律文件、完整代码库或数周的聊天记录，并在完整输入上完成回答、摘要或抽取。

本模型仅部署在大陆 Bailian endpoint（bailian-cn），没有新加坡兜底 — 如果 bailian-cn 不可用，模型即不可用。请在重试策略中考虑这一点。

10M 上下文

Qwen 家族最大的商用上下文。多数文档级任务无需分块或 map-reduce。

文档分析

擅长跨段落推理、全文问答、合同评审与多文件代码摘要。

每 token 成本极低

$0.12 输入 / $0.45 输出 per MTok — 在如此大的上下文窗口下属极致性价比。

仅 CN 部署

运行在 bailian-cn，没有新加坡兜底 — 区域固定在大陆。

适合使用

整文档分析、合同 / 法规评审、仓库级代码摘要、长转录 Q&A — 任何分块会丢失跨段上下文的场景。

不适合使用

延迟敏感的对话或必须在新加坡（bailian-sg）可用的工作负载 — qwen-long 仅在 CN 部署，且为长输入吞吐而调优，并非为快速逐轮响应优化。

计费方式：$0.12 输入 / $0.45 输出 per MTok。仅 CN 部署 — 无新加坡兜底。

上下文长度

10.5M

最大输出

输入价格每百万 tokens

$0.144每百万 Tokens

输出价格每百万 tokens

$0.540每百万 Tokens

模态能力

文本→文本

价格明细

类型	费率
输入	$0.144 每百万 Tokens
输出	$0.540 每百万 Tokens

支持参数

temperaturemax_tokenstop_presponse_formatstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai；旧中国加速端点已下线。

cURL

curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen-long",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'