Qwen-Image 上线 DashScope:新图像生成与编辑 API 对异步媒体路由的影响
阿里云在 DashScope 发布 Qwen-Image 和 Qwen-Image-Edit,模型 ID 为 qwen-image-2.0-pro。路由团队需关注其与 DALL-E 不同的异步任务模式和新的模型命名空间,标准 OpenAI 兼容代理可能无法正确处理。

阿里云本周发布 Qwen-Image 和 Qwen-Image-Edit 时,大多数报道聚焦于基准测试数字和中文字符渲染质量。对 AI 路由团队而言,真正重要的工程问题是:这些模型在 DashScope API 中如何落地,以及对任何位于其前端的网关或代理意味着什么?
DashScope 模型目录现已将 qwen-image-2.0-pro 列为当前图像生成模型,与现有的视频和语音生成端点并列。如果你的路由层将所有 DashScope 流量视为统一的 /chat/completions 命名空间,即将遇到不匹配问题。
发生了什么
阿里巴巴 Qwen 团队在数天内连续发布了两个相关模型:
Qwen-Image 是一款 20B MMDiT(多模态扩散 Transformer)图像基础模型,具备两项核心能力:卓越的文字渲染(支持多行中英文高保真渲染)和一致的图像编辑。它已在 Qwen Chat 和 DashScope API 上线,模型 ID 为 qwen-image-2.0-pro。
Qwen-Image-Edit 在 Qwen-Image 基础上扩展了图像编辑能力,同时支持语义编辑(风格迁移、物体旋转、IP 创作)和外观编辑(元素增删改色,控制区域保持不变)。该模型采用双编码器架构,将输入图像同时送入 Qwen2.5-VL(语义控制)和 VAE 编码器(像素级外观保真),精准的双语(中英文)文字编辑是其突出能力。
两款模型在 GenEval、DPG、GEdit、ImgEdit 等标准基准上均达到最优水平。在中文文字渲染方面,与先前模型的差距尤为显著。
对 AI 工程团队的影响
负责路由图像生成工作负载的团队——设计工具、电商商品图流水线、文档编辑器、多模态编码智能体——面临三个具体决策:
1. 模型 ID 命名空间。 DashScope 图像生成使用独立于文本生成的模型家族。新 ID 为 qwen-image-2.0-pro,而非 qwen3.7-max 或 qwen3.6-plus 的变体。如果你的路由配置将所有 DashScope 流量映射到文本模型 ID,图像生成请求将被发送到错误端点,导致预期外的报错或静默异常。
2. API 接口差异。 DashScope 图像生成使用与 /chat/completions 不同的 API 路径。模型接受图像生成和编辑提示词,但请求和响应 schema 与标准对话补全格式不同。盲目将 model: qwen-image-2.0-pro 请求转发到文本生成端点的网关,将以非显而易见的方式在应用层静默失败。
3. 异步任务生命周期。 图像生成——无论在 DashScope、OpenAI DALL-E 还是 Replicate——通常是异步的:API 接受任务、返回任务 ID,客户端轮询完成状态。如果代理层未正确处理异步图像生成任务生命周期(提交 → 轮询 /v1/jobs/:id → 获取结果),你将面临响应不完整或任务失败被静默吞掉的风险。
中文文字渲染能力对于面向中国市场的双语或中文场景同样重要。对于文档流水线、营销图像生成或面向中国市场的多模态应用,qwen-image-2.0-pro 现已是该层级中能力最强的选项。路由策略应反映这一点:将中文文字渲染图像任务路由到此模型,而非默认使用 DALL-E 或基于 Flux 的端点。
路由与运营视角
大多数 OpenAI 兼容网关(包括许多商业代理)以最小路由逻辑直通处理 /v1/images/generations。DashScope 图像生成端点需要特定的模型 ID 知识,并可能需要特定于 provider 的额外参数。
路由团队应自查以下事项:
- 模型 ID 注册表:你的网关模型注册表是否已将
qwen-image-2.0-pro映射到正确的 DashScope 图像生成端点?还是缺失导致回退到错误端点? - 异步媒体处理:当 DashScope 图像生成请求返回任务 ID 而非立即返回图像时,你的网关是否能正确将任务 ID 暴露给客户端,还是会阻塞等待永远不会到来的同步响应?
- 图像生成的回退链:如果你有从 DALL-E 到 DashScope 图像生成的回退(出于成本或可用性考虑),回退路径需要映射到正确的 DashScope 图像 API 端点和模型 ID,而非文本补全端点。
- 响应 schema 归一化:DALL-E 以
data[].b64_json或data[].url返回图像。DashScope 图像响应可能遵循不同结构。为下游客户端归一化这些 schema 的网关层在新增 provider 图像端点时需要同步更新。
Qwen-Image-Edit 引入了额外的路由决策:一个类似 /images/edits 的端点,接受输入图像加文字指令。该模型属于同一 qwen-image-2.0-pro 家族,但可能使用独立的 DashScope 端点。如果你今天正在路由图像编辑请求(到 GPT-Image-1.5 或 Gemini Imagen 3),qwen-image-2.0-pro 的编辑能力——尤其对于中文文字资产——值得作为路由策略中的替代选项评估。
成本与区域路由:DashScope 图像生成按每张图片计费,而非按 token。进行成本优化路由的团队需要以每张输出图片为基准与 DALL-E 3 / GPT-Image-1.5 / Flux 定价比较。DashScope 的中国区端点(北京)以及国际端点(美国弗吉尼亚、新加坡)也提供了与延迟和合规需求相关的区域路由选择。
TheRouter 用户需要关注和尝试的事项
对于使用 TheRouter 或在 DashScope 上构建路由配置的团队:
- 将
qwen-image-2.0-pro添加到你的 DashScope provider 模型列表,如果你在路由图像生成工作负载。确认图像生成和图像编辑端点是否需要独立的 provider 配置。 - 验证路由层中的异步媒体任务处理。TheRouter 的异步媒体路径(异步媒体文档)处理图像生成任务的提交/轮询/获取生命周期。如果你在路由 DashScope 图像生成请求,确认端点已配置为异步处理,而非阻塞式对话补全转发。
- 针对双语或中国市场流水线进行评估。如果你的应用生成包含中文或中英混合文字的图像,
qwen-image-2.0-pro现在是 DashScope 开放目录中能力最强的选项,考虑增加将中文文字渲染请求专门指向此模型的路由规则。 - 关注 DashScope 国际端点的可用性。该模型目前已在中国区 DashScope 端点(
dashscope.aliyuncs.com)上线确认。持续关注美国弗吉尼亚(dashscope-us.aliyuncs.com)和新加坡(dashscope-intl.aliyuncs.com)端点图像生成模型可用性的推进情况。
核心结论:Qwen-Image 不只是另一个图像模型发布。它标志着 DashScope OpenAI 兼容接口中完整的图像生成 + 编辑流水线的到来——这需要独立的路由配置、异步任务处理和模型 ID 注册,才能在多 provider 网关中正确工作。
相关阅读
最新 AI 新闻 →
Qwen-MT Turbo:阿里云专用翻译 API 的 extra_body 路由参数陷阱
阿里云 Qwen-MT turbo 通过 OpenAI 兼容接口提供,但翻译控制参数藏在 extra_body 中——这种模式会导致任何会剥离非标准字段的中间件悄然丢失关键配置。路由团队必须关注这个细节。

Qwen3Guard:阿里巴巴开源流式安全护栏,为多 Provider AI 路由层带来统一内容过滤
阿里巴巴发布 Qwen3Guard 开源安全护栏模型,支持逐 token 实时流式检测,三级风险分类。对跨多个 AI Provider 路由的工程团队来说,这是首个可部署在网关层的 provider 无关安全过滤模型。

DeepSeek 正式支持 Anthropic API 格式:新双协议端点对路由层意味着什么
DeepSeek API 现已在 api.deepseek.com/anthropic 支持 Anthropic SDK 格式请求,Claude Code、Anthropic Python/TS SDK 及任何 Anthropic 原生客户端无需 OpenAI 转换层,即可直接将请求路由至 DeepSeek V4 模型。