Qwen3 VL Plus

qwenqwen/qwen3-vl-plus

Qwen3 视觉语言 — 文本 + 图像输入、文本输出，256K 上下文。

qwen3-vl-plus 是 Qwen3 代的视觉语言模型。在同一个 OpenAI 兼容 `messages` 数组中同时接受文本与图像内容，输出文本答案 — 适合文档理解、图表阅读、UI 截图分析、轻量 OCR 抽取以及视觉问答。

图像可通过 HTTP URL 或 base64 data URI 传入。256K 上下文使你能在单次调用中打包多张图像及其文字指令。TheRouter 按请求在 bailian-cn 与 bailian-sg 之间选择更便宜的一侧。

文本 + 图像输入

混合模态 `messages` 内容，带 `image_url` parts — 与 OpenAI 格式兼容。

256K 上下文

单次调用打包多张图像及其 prompt。非常适合多页文档 VQA。

轻量 OCR 抽取

擅长读取图像内文字 — 图表、截图、扫描表单 — 无需专用 OCR 流水线。

双区域路由

Selector 按请求基于成本选择 bailian-cn 或 bailian-sg。

适合使用

文档 VQA、图表与截图理解、轻量 OCR、UI 元素抽取，以及任何混合文字指令与图像内容的工作负载。

不适合使用

纯文本推理（使用 qwen-plus / qwen3-max）、文本生成图像（使用 wan/wan2.2-t2i-*）或音频 / 视频理解 — qwen3-vl-plus 不输出图像也不接受音频。

计费方式：$0.30 输入 / $2.00 输出 per MTok。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。图像内容按 Bailian 公布的图像 token 化大小计费。

上下文长度

262K

最大输出

16K

输入价格每百万 tokens

$0.360每百万 Tokens

输出价格每百万 tokens

$2.40每百万 Tokens

模态能力

文本图像→文本

价格明细

类型	费率
输入	$0.360 每百万 Tokens
输出	$2.40 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolsresponse_formatstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai；旧中国加速端点已下线。

cURL

curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen3-vl-plus",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'