返回模型列表
GLM 4.5 Air
zhipuzhipu/glm-4.5-air
性价比 GLM 聊天模型 — siliconflow + zhipu 双供应商兜底。
glm-4.5-air 是 GLM-4.5 家族的轻量版本 — 在旗舰模型几分之一的价格下提供扎实的推理与工具调用能力。截至 2026-05,在 TheRouter 上的定价为输入 $0.15 / 百万 token、输出 $1.20 / 百万 token。
TheRouter 默认通过 siliconflow-intl(priority 0)路由 glm-4.5-air,并在 siliconflow 返回 5xx 或超时时透明回落到 BigModel 直连(zhipu-cn,priority 1)。你只发一个 OpenAI 兼容请求,failover 由我们处理。
轻量级推理
支持 reasoning、function calling、JSON mode 与 prompt caching,小模型级别的延迟。
双供应商路由
Siliconflow 主、BigModel 直连兜底 — failover 静默且自动。
中文表现优秀
原生中文语料训练,中文场景表现稳定。
OpenAI 兼容
同样的 `/v1/chat/completions` 端点、同样的 SDK — 只需切换 model ID。
适合使用
高并发、中文为主的聊天负载,且关注 token 成本:客服、内容改写、摘要、agent 编排等。
不适合使用
面对硬推理、复杂代码或英文为主的高价值任务时,请选择旗舰模型(glm-4.7、claude-sonnet、gpt-5)。
计费方式:$0.15 输入 / $1.20 输出 per MTok。相对 CN 成本约 26% 利润率。
阅读 glm-4.5-air 教程 →上下文长度
131K
最大输出
66K
输入价格每百万 tokens
$0.180每百万 Tokens
输出价格每百万 tokens
$1.44每百万 Tokens
模态能力
文本→文本
价格明细
| 类型 | 费率 |
|---|---|
| 输入 | $0.180 每百万 Tokens |
| 输出 | $1.44 每百万 Tokens |
支持参数
temperaturemax_tokenstop_ptoolstool_choicestop
API 使用示例
所有新集成都应使用下方示例中的全球端点 api.therouter.ai;旧中国加速端点已下线。
cURL
curl https://api.therouter.ai/v1/chat/completions -H "Content-Type: application/json" -H "Authorization: Bearer $THE_ROUTER_API_KEY" -d '{
"model": "zhipu/glm-4.5-air",
"messages": [
{"role": "user", "content": "Summarize the key points from this input."}
]
}'