智谱联网搜索与 GLM-4.5-Air 已在 TheRouter 上线
五条智谱 BigModel 路由刚在 TheRouter 上线 — 四个带引用标注的联网搜索引擎,以及性价比型的 zhipu/glm-4.5-air 聊天模型。全部 OpenAI 兼容,多数场景只需切换 endpoint 即可接入。
本次上线了什么
四个按次计费的搜索引擎 — 每次调用最多返回 10 条排序后的网页结果,包含 title、URL 与内容摘要,包装为 OpenAI chat.completion,附带 url_citation annotations:
| 模型 | 引擎 | 适用场景 | 价格 |
|---|---|---|---|
| zhipu/search-std | BigModel 通用 | 最便宜的检索增强 | $0.0036/req |
| zhipu/search-pro | BigModel 旗舰 | 丰富摘要、可过滤 | $0.0108/req |
| zhipu/search-pro-sogou | 搜狗索引 | 中国新闻、微信、百科 | $0.0168/req |
| zhipu/search-pro-quark | 夸克(阿里) | 电商、生活、教育 | $0.0168/req |
另外重新启用了 zhipu/glm-4.5-air 的直连路由 — 智谱的性价比 GLM 聊天模型,输入 $0.15 / 输出 $1.20 per MTok,主路由为 siliconflow、备用为 zhipu-cn 透明回退。
为什么按次搜索很关键
当下大多数 RAG 栈要么按 token 付费给 tool-calling agent loop,要么按订阅价付给 SaaS 搜索 API。 按次计费 — $0.0036 至 $0.0168 per call — 把两者统一为一个 chat-completion 形态。 一次 HTTP 调用,返回 10 条引用,成本可预测。
因为响应携带 url_citation annotations,start_index / end_index 按字节精确对齐 markdown body — 下游已经处理 OpenAI tool output(或 gpt-5、claude-opus-4.7 等模型的 web-search 引用)的代码可以直接接入,无需改造。
四个引擎,何时选哪个
- search-std — 低预算检索增强的默认选项。信封与其他引擎完全一致,最便宜。
- search-pro — 生产环境 RAG 与回答引擎的检索增强。摘要更丰富,支持
search_recency_filter、search_domain_filter、content_size: high。 - search-pro-sogou — 中国大陆覆盖最强。微信公众号、百科、监管与新闻类内容搜狗占优。
- search-pro-quark — 阿里夸克索引。与搜狗排序不同;电商、生活、健康、教育领域表现突出。
响应信封
搜索结果以一个 chat.completion 返回,没有 token 用量,但有一个按次计数器:
{
"id": "20260520152358c6c4c87c07854a05",
"object": "chat.completion",
"created": 1779261839,
"model": "zhipu/search-pro",
"choices": [{
"index": 0,
"message": {
"role": "assistant",
"content": "- [Smith report](https://example.com/smith) — Findings published 2026.\n- [Jones analysis](https://example.com/jones) — Follow-up coverage.",
"annotations": [
{
"type": "url_citation",
"url_citation": {
"url": "https://example.com/smith",
"title": "Smith report",
"content": "Findings published 2026.",
"start_index": 0,
"end_index": 70
}
}
]
},
"finish_reason": "stop"
}],
"usage": {
"prompt_tokens": 0,
"completion_tokens": 0,
"total_tokens": 0,
"web_search_requests": 1
}
}message.content 是 markdown 项目符号列表,一行一条结果。 每行也作为一条 url_citation annotation 暴露,带字节范围。 流式请求返回一个 chunk + [DONE] 终止符(BigModel 不支持流式分片,我们也不伪造)。
glm-4.5-air 重新路由
现有使用 zhipu/glm-4.5-air 的客户无需修改任何东西。 我们把对外价格调整为 $0.15 / $1.20 per MTok(输入/输出)以保证合理利润率,并通过 BigModel 直连(zhipu-cn)增加 priority-1 兜底。 主路由仍是 siliconflow-intl — failover 透明且自动。
如何开始
向 TheRouter 的 OpenAI 兼容端点发起一次 curl 即可:
curl https://api.therouter.ai/v1/chat/completions \
-H "Authorization: Bearer $THE_ROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "zhipu/search-pro",
"messages": [{"role": "user", "content": "GLM-5 model release date"}]
}'更深入的教程:
- 联网搜索教程 — cURL / Python / JS 示例;过滤参数;引擎对比
- glm-4.5-air 教程 — 何时选用、成本对比、路由布局
或浏览模型详情页: