Qwen Turbo

qwenqwen/qwen-turbo

高吞吐、低延迟 Qwen — 面向规模化负载。

qwen-turbo 为吞吐与延迟而优化。提供与更大 Qwen 档相同的 OpenAI 兼容 API，价格为 $0.07 输入 / $0.25 输出 per MTok — 非常适合 per-call 成本主导的高并发对话、分类与改写场景。

尽管价格低廉，仍然保留 1M context window — 降档时不会牺牲长文档能力。TheRouter 按请求在 bailian-cn 与 bailian-sg 之间选择更便宜的一侧。

低延迟

针对首 token 速度与 tokens-per-second 做了优化 — 非常适合流式 UI。

1M 上下文

与 qwen-plus 相同的 1M 上下文，价格只是其一小部分。

规模化下成本极低

$0.07 输入 / $0.25 输出 per MTok。可以从容承担批量分类、打标与改写负载。

双区域路由

Selector 按请求选择 bailian-cn / bailian-sg 中更便宜的一侧。

适合使用

高并发对话、内容改写、分类、打标、摘要流水线，以及任何 per-call 成本主导的工作负载。

不适合使用

硬推理、复杂编码、深度工具调用的 agent 循环 — 请升级到 qwen-plus、qwen-max 或 qwen3-max。

计费方式：$0.07 输入 / $0.25 输出 per MTok。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。

上下文长度

1.0M

最大输出

33K

输入价格每百万 tokens

$0.084每百万 Tokens

输出价格每百万 tokens

$0.300每百万 Tokens

模态能力

文本→文本

价格明细

类型	费率
输入	$0.084 每百万 Tokens
输出	$0.300 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai；旧中国加速端点已下线。

cURL

curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen-turbo",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'