返回模型列表
Qwen Long
qwenqwen/qwen-long
10M token 长上下文 Qwen — 面向文档级分析。
qwen-long 是 Qwen 家族的长上下文专项模型。10M token 的上下文窗口可一次性吞入整本书、数百页的法律文件、完整代码库或数周的聊天记录,并在完整输入上完成回答、摘要或抽取。
本模型仅部署在大陆 Bailian endpoint(bailian-cn),没有新加坡兜底 — 如果 bailian-cn 不可用,模型即不可用。请在重试策略中考虑这一点。
10M 上下文
Qwen 家族最大的商用上下文。多数文档级任务无需分块或 map-reduce。
文档分析
擅长跨段落推理、全文问答、合同评审与多文件代码摘要。
每 token 成本极低
$0.12 输入 / $0.45 输出 per MTok — 在如此大的上下文窗口下属极致性价比。
仅 CN 部署
运行在 bailian-cn,没有新加坡兜底 — 区域固定在大陆。
适合使用
整文档分析、合同 / 法规评审、仓库级代码摘要、长转录 Q&A — 任何分块会丢失跨段上下文的场景。
不适合使用
延迟敏感的对话或必须在新加坡(bailian-sg)可用的工作负载 — qwen-long 仅在 CN 部署,且为长输入吞吐而调优,并非为快速逐轮响应优化。
计费方式:$0.12 输入 / $0.45 输出 per MTok。仅 CN 部署 — 无新加坡兜底。
上下文长度
10.5M
最大输出
8K
输入价格每百万 tokens
$0.144每百万 Tokens
输出价格每百万 tokens
$0.540每百万 Tokens
模态能力
文本→文本
价格明细
| 类型 | 费率 |
|---|---|
| 输入 | $0.144 每百万 Tokens |
| 输出 | $0.540 每百万 Tokens |
支持参数
temperaturemax_tokenstop_presponse_formatstop
API 使用示例
所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。
cURL
curl https://api.therouter.ai/v1/chat/completions -H "Content-Type: application/json" -H "Authorization: Bearer $THE_ROUTER_API_KEY" -d '{
"model": "qwen/qwen-long",
"messages": [
{"role": "user", "content": "Summarize the key points from this input."}
]
}'