返回模型列表
Qwen Turbo
qwenqwen/qwen-turbo
高吞吐、低延迟 Qwen — 面向规模化负载。
qwen-turbo 为吞吐与延迟而优化。提供与更大 Qwen 档相同的 OpenAI 兼容 API,价格为 $0.07 输入 / $0.25 输出 per MTok — 非常适合 per-call 成本主导的高并发对话、分类与改写场景。
尽管价格低廉,仍然保留 1M context window — 降档时不会牺牲长文档能力。TheRouter 按请求在 bailian-cn 与 bailian-sg 之间选择更便宜的一侧。
低延迟
针对首 token 速度与 tokens-per-second 做了优化 — 非常适合流式 UI。
1M 上下文
与 qwen-plus 相同的 1M 上下文,价格只是其一小部分。
规模化下成本极低
$0.07 输入 / $0.25 输出 per MTok。可以从容承担批量分类、打标与改写负载。
双区域路由
Selector 按请求选择 bailian-cn / bailian-sg 中更便宜的一侧。
适合使用
高并发对话、内容改写、分类、打标、摘要流水线,以及任何 per-call 成本主导的工作负载。
不适合使用
硬推理、复杂编码、深度工具调用的 agent 循环 — 请升级到 qwen-plus、qwen-max 或 qwen3-max。
计费方式:$0.07 输入 / $0.25 输出 per MTok。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。
上下文长度
1.0M
最大输出
33K
输入价格每百万 tokens
$0.084每百万 Tokens
输出价格每百万 tokens
$0.300每百万 Tokens
模态能力
文本→文本
价格明细
| 类型 | 费率 |
|---|---|
| 输入 | $0.084 每百万 Tokens |
| 输出 | $0.300 每百万 Tokens |
支持参数
temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop
API 使用示例
所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。
cURL
curl https://api.therouter.ai/v1/chat/completions -H "Content-Type: application/json" -H "Authorization: Bearer $THE_ROUTER_API_KEY" -d '{
"model": "qwen/qwen-turbo",
"messages": [
{"role": "user", "content": "Summarize the key points from this input."}
]
}'