·上线·English →·Русская версия →

智谱联网搜索与 GLM-4.5-Air 已在 TheRouter 上线

五条智谱 BigModel 路由刚在 TheRouter 上线 — 四个带引用标注的联网搜索引擎,以及性价比型的 zhipu/glm-4.5-air 聊天模型。全部 OpenAI 兼容,多数场景只需切换 endpoint 即可接入。


本次上线了什么

四个按次计费的搜索引擎 — 每次调用最多返回 10 条排序后的网页结果,包含 title、URL 与内容摘要,包装为 OpenAI chat.completion,附带 url_citation annotations:

模型引擎适用场景价格
zhipu/search-stdBigModel 通用最便宜的检索增强$0.0036/req
zhipu/search-proBigModel 旗舰丰富摘要、可过滤$0.0108/req
zhipu/search-pro-sogou搜狗索引中国新闻、微信、百科$0.0168/req
zhipu/search-pro-quark夸克(阿里)电商、生活、教育$0.0168/req

另外重新启用了 zhipu/glm-4.5-air 的直连路由 — 智谱的性价比 GLM 聊天模型,输入 $0.15 / 输出 $1.20 per MTok,主路由为 siliconflow、备用为 zhipu-cn 透明回退。

为什么按次搜索很关键

当下大多数 RAG 栈要么按 token 付费给 tool-calling agent loop,要么按订阅价付给 SaaS 搜索 API。 按次计费 — $0.0036 至 $0.0168 per call — 把两者统一为一个 chat-completion 形态。 一次 HTTP 调用,返回 10 条引用,成本可预测。

因为响应携带 url_citation annotations,start_index / end_index 按字节精确对齐 markdown body — 下游已经处理 OpenAI tool output(或 gpt-5、claude-opus-4.7 等模型的 web-search 引用)的代码可以直接接入,无需改造。

四个引擎,何时选哪个

  • search-std — 低预算检索增强的默认选项。信封与其他引擎完全一致,最便宜。
  • search-pro — 生产环境 RAG 与回答引擎的检索增强。摘要更丰富,支持 search_recency_filtersearch_domain_filtercontent_size: high
  • search-pro-sogou — 中国大陆覆盖最强。微信公众号、百科、监管与新闻类内容搜狗占优。
  • search-pro-quark — 阿里夸克索引。与搜狗排序不同;电商、生活、健康、教育领域表现突出。

响应信封

搜索结果以一个 chat.completion 返回,没有 token 用量,但有一个按次计数器:

{
  "id": "20260520152358c6c4c87c07854a05",
  "object": "chat.completion",
  "created": 1779261839,
  "model": "zhipu/search-pro",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "- [Smith report](https://example.com/smith) — Findings published 2026.\n- [Jones analysis](https://example.com/jones) — Follow-up coverage.",
      "annotations": [
        {
          "type": "url_citation",
          "url_citation": {
            "url": "https://example.com/smith",
            "title": "Smith report",
            "content": "Findings published 2026.",
            "start_index": 0,
            "end_index": 70
          }
        }
      ]
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 0,
    "completion_tokens": 0,
    "total_tokens": 0,
    "web_search_requests": 1
  }
}

message.content 是 markdown 项目符号列表,一行一条结果。 每行也作为一条 url_citation annotation 暴露,带字节范围。 流式请求返回一个 chunk + [DONE] 终止符(BigModel 不支持流式分片,我们也不伪造)。

glm-4.5-air 重新路由

现有使用 zhipu/glm-4.5-air 的客户无需修改任何东西。 我们把对外价格调整为 $0.15 / $1.20 per MTok(输入/输出)以保证合理利润率,并通过 BigModel 直连(zhipu-cn)增加 priority-1 兜底。 主路由仍是 siliconflow-intl — failover 透明且自动。

如何开始

向 TheRouter 的 OpenAI 兼容端点发起一次 curl 即可:

curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THE_ROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "zhipu/search-pro",
    "messages": [{"role": "user", "content": "GLM-5 model release date"}]
  }'

更深入的教程:

或浏览模型详情页:

客服支持