返回模型列表

Qwen Long

qwenqwen/qwen-long

10M token 长上下文 Qwen — 面向文档级分析。

qwen-long 是 Qwen 家族的长上下文专项模型。10M token 的上下文窗口可一次性吞入整本书、数百页的法律文件、完整代码库或数周的聊天记录,并在完整输入上完成回答、摘要或抽取。

本模型仅部署在大陆 Bailian endpoint(bailian-cn),没有新加坡兜底 — 如果 bailian-cn 不可用,模型即不可用。请在重试策略中考虑这一点。

10M 上下文
Qwen 家族最大的商用上下文。多数文档级任务无需分块或 map-reduce。
文档分析
擅长跨段落推理、全文问答、合同评审与多文件代码摘要。
每 token 成本极低
$0.12 输入 / $0.45 输出 per MTok — 在如此大的上下文窗口下属极致性价比。
仅 CN 部署
运行在 bailian-cn,没有新加坡兜底 — 区域固定在大陆。
适合使用
整文档分析、合同 / 法规评审、仓库级代码摘要、长转录 Q&A — 任何分块会丢失跨段上下文的场景。
不适合使用
延迟敏感的对话或必须在新加坡(bailian-sg)可用的工作负载 — qwen-long 仅在 CN 部署,且为长输入吞吐而调优,并非为快速逐轮响应优化。
计费方式:$0.12 输入 / $0.45 输出 per MTok。仅 CN 部署 — 无新加坡兜底。
上下文长度
10.5M
最大输出
8K
输入价格每百万 tokens
$0.144每百万 Tokens
输出价格每百万 tokens
$0.540每百万 Tokens

模态能力

文本文本

价格明细

类型费率
输入$0.144 每百万 Tokens
输出$0.540 每百万 Tokens

支持参数

temperaturemax_tokenstop_presponse_formatstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。

cURL
curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen-long",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'
客服支持