返回模型列表

Qwen Flash

qwenqwen/qwen-flash

Qwen 最便宜的商用档 — 输入输出两端都大幅折扣。

qwen-flash 是 Bailian 上最便宜的 Qwen 商用档。相同的 OpenAI 兼容接口、相同的 1M 上下文,但定价瞄准批量处理端 — $0.07 输入 / $0.50 输出 per MTok。

适合作为后台任务与异步流水线的默认选择:日志富化、embedding 预处理、大规模改写,或任何按每百万请求衡量成本(而非按次衡量)的工作负载。

最低的商用价格
$0.07 输入 / $0.50 输出 per MTok — Qwen 商用线的价格下限。
保留 1M 上下文
与 qwen-turbo / qwen-plus 相同的长上下文能力 — 多数任务无需分块。
适合批量
为高 RPS 批量流量而设计。离线流水线的优秀默认值。
双区域路由
Selector 按请求基于成本选择 bailian-cn 或 bailian-sg。
适合使用
离线批量任务、日志富化、大规模改写、打标、embedding 预处理 — 质量可接受、按每百万请求衡量成本的场景。
不适合使用
推理质量敏感的用户对话、复杂编码或对下游业务有可测量影响的任务 — 请使用 qwen-plus 或更高档。
计费方式:$0.07 输入 / $0.50 输出 per MTok。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。
上下文长度
1.0M
最大输出
33K
输入价格每百万 tokens
$0.084每百万 Tokens
输出价格每百万 tokens
$0.600每百万 Tokens

模态能力

文本文本

价格明细

类型费率
输入$0.084 每百万 Tokens
输出$0.600 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。

cURL
curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen-flash",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'
客服支持