返回模型列表

Qwen Turbo

qwenqwen/qwen-turbo

高吞吐、低延迟 Qwen — 面向规模化负载。

qwen-turbo 为吞吐与延迟而优化。提供与更大 Qwen 档相同的 OpenAI 兼容 API,价格为 $0.07 输入 / $0.25 输出 per MTok — 非常适合 per-call 成本主导的高并发对话、分类与改写场景。

尽管价格低廉,仍然保留 1M context window — 降档时不会牺牲长文档能力。TheRouter 按请求在 bailian-cn 与 bailian-sg 之间选择更便宜的一侧。

低延迟
针对首 token 速度与 tokens-per-second 做了优化 — 非常适合流式 UI。
1M 上下文
与 qwen-plus 相同的 1M 上下文,价格只是其一小部分。
规模化下成本极低
$0.07 输入 / $0.25 输出 per MTok。可以从容承担批量分类、打标与改写负载。
双区域路由
Selector 按请求选择 bailian-cn / bailian-sg 中更便宜的一侧。
适合使用
高并发对话、内容改写、分类、打标、摘要流水线,以及任何 per-call 成本主导的工作负载。
不适合使用
硬推理、复杂编码、深度工具调用的 agent 循环 — 请升级到 qwen-plus、qwen-max 或 qwen3-max。
计费方式:$0.07 输入 / $0.25 输出 per MTok。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。
上下文长度
1.0M
最大输出
33K
输入价格每百万 tokens
$0.084每百万 Tokens
输出价格每百万 tokens
$0.300每百万 Tokens

模态能力

文本文本

价格明细

类型费率
输入$0.084 每百万 Tokens
输出$0.300 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。

cURL
curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen-turbo",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'
客服支持