GLM 4.5 Air

zhipuzhipu/glm-4.5-air

性价比 GLM 聊天模型 — siliconflow + zhipu 双供应商兜底。

glm-4.5-air 是 GLM-4.5 家族的轻量版本 — 在旗舰模型几分之一的价格下提供扎实的推理与工具调用能力。截至 2026-05，在 TheRouter 上的定价为输入 $0.15 / 百万 token、输出 $1.20 / 百万 token。

TheRouter 默认通过 siliconflow-intl（priority 0）路由 glm-4.5-air，并在 siliconflow 返回 5xx 或超时时透明回落到 BigModel 直连（zhipu-cn，priority 1）。你只发一个 OpenAI 兼容请求，failover 由我们处理。

轻量级推理

支持 reasoning、function calling、JSON mode 与 prompt caching，小模型级别的延迟。

双供应商路由

Siliconflow 主、BigModel 直连兜底 — failover 静默且自动。

中文表现优秀

原生中文语料训练，中文场景表现稳定。

OpenAI 兼容

同样的 `/v1/chat/completions` 端点、同样的 SDK — 只需切换 model ID。

适合使用

高并发、中文为主的聊天负载，且关注 token 成本：客服、内容改写、摘要、agent 编排等。

不适合使用

面对硬推理、复杂代码或英文为主的高价值任务时，请选择旗舰模型（glm-4.7、claude-sonnet、gpt-5）。

计费方式：$0.15 输入 / $1.20 输出 per MTok。相对 CN 成本约 26% 利润率。

阅读 glm-4.5-air 教程 →

上下文长度

131K

最大输出

66K

输入价格每百万 tokens

$0.180每百万 Tokens

输出价格每百万 tokens

$1.44每百万 Tokens

模态能力

文本→文本

价格明细

类型	费率
输入	$0.180 每百万 Tokens
输出	$1.44 每百万 Tokens

支持参数

temperaturemax_tokenstop_ptoolstool_choicestop

API 使用示例

所有新集成都应使用下方示例中的全球端点 api.therouter.ai；旧中国加速端点已下线。

cURL

curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "zhipu/glm-4.5-air",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'