Qwen Flash

qwenqwen/qwen-flash

Qwen 最便宜的商用档 — 输入输出两端都大幅折扣。

qwen-flash 是 Bailian 上最便宜的 Qwen 商用档。相同的 OpenAI 兼容接口、相同的 1M 上下文，但定价瞄准批量处理端 — $0.07 输入 / $0.50 输出 per MTok。

适合作为后台任务与异步流水线的默认选择：日志富化、embedding 预处理、大规模改写，或任何按每百万请求衡量成本（而非按次衡量）的工作负载。

最低的商用价格

$0.07 输入 / $0.50 输出 per MTok — Qwen 商用线的价格下限。

保留 1M 上下文

与 qwen-turbo / qwen-plus 相同的长上下文能力 — 多数任务无需分块。

适合批量

为高 RPS 批量流量而设计。离线流水线的优秀默认值。

双区域路由

Selector 按请求基于成本选择 bailian-cn 或 bailian-sg。

适合使用

离线批量任务、日志富化、大规模改写、打标、embedding 预处理 — 质量可接受、按每百万请求衡量成本的场景。

不适合使用

推理质量敏感的用户对话、复杂编码或对下游业务有可测量影响的任务 — 请使用 qwen-plus 或更高档。

计费方式：$0.07 输入 / $0.50 输出 per MTok。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。

上下文长度

1.0M

最大输出

33K

输入价格每百万 tokens

$0.084每百万 Tokens

输出价格每百万 tokens

$0.600每百万 Tokens

模态能力

文本→文本

价格明细

类型	费率
输入	$0.084 每百万 Tokens
输出	$0.600 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai；旧中国加速端点已下线。

cURL

curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen-flash",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'