返回模型列表

Qwen3 VL Plus

qwenqwen/qwen3-vl-plus

Qwen3 视觉语言 — 文本 + 图像输入、文本输出,256K 上下文。

qwen3-vl-plus 是 Qwen3 代的视觉语言模型。在同一个 OpenAI 兼容 `messages` 数组中同时接受文本与图像内容,输出文本答案 — 适合文档理解、图表阅读、UI 截图分析、轻量 OCR 抽取以及视觉问答。

图像可通过 HTTP URL 或 base64 data URI 传入。256K 上下文使你能在单次调用中打包多张图像及其文字指令。TheRouter 按请求在 bailian-cn 与 bailian-sg 之间选择更便宜的一侧。

文本 + 图像输入
混合模态 `messages` 内容,带 `image_url` parts — 与 OpenAI 格式兼容。
256K 上下文
单次调用打包多张图像及其 prompt。非常适合多页文档 VQA。
轻量 OCR 抽取
擅长读取图像内文字 — 图表、截图、扫描表单 — 无需专用 OCR 流水线。
双区域路由
Selector 按请求基于成本选择 bailian-cn 或 bailian-sg。
适合使用
文档 VQA、图表与截图理解、轻量 OCR、UI 元素抽取,以及任何混合文字指令与图像内容的工作负载。
不适合使用
纯文本推理(使用 qwen-plus / qwen3-max)、文本生成图像(使用 wan/wan2.2-t2i-*)或音频 / 视频理解 — qwen3-vl-plus 不输出图像也不接受音频。
计费方式:$0.30 输入 / $2.00 输出 per MTok。TheRouter 按请求路由到 bailian-cn / bailian-sg 中更便宜的一侧。图像内容按 Bailian 公布的图像 token 化大小计费。
上下文长度
262K
最大输出
16K
输入价格每百万 tokens
$0.360每百万 Tokens
输出价格每百万 tokens
$2.40每百万 Tokens

模态能力

文本图像文本

价格明细

类型费率
输入$0.360 每百万 Tokens
输出$2.40 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolsresponse_formatstop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。

cURL
curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen3-vl-plus",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'
客服支持