Zhipu Web Search и GLM-4.5-Air теперь доступны в TheRouter
На TheRouter появились пять маршрутов Zhipu BigModel — четыре поисковых движка с цитированием и экономичная чат-модель zhipu/glm-4.5-air. Все маршруты OpenAI-совместимы, обычно достаточно изменить один параметр endpoint.
Что запустили
Четыре оплачиваемых за запрос поисковых движка. Каждый возвращает до десяти ранжированных страниц с заголовком, URL и фрагментом контента, обёрнутых в OpenAI chat.completion с url_citation аннотациями:
| Модель | Движок | Лучше для | Цена |
|---|---|---|---|
| zhipu/search-std | BigModel общий | Самый дешёвый grounding | $0.0036/req |
| zhipu/search-pro | BigModel флагман | Богаче сниппеты, фильтры | $0.0108/req |
| zhipu/search-pro-sogou | Индекс Sogou | Китайские новости, WeChat, Baike | $0.0168/req |
| zhipu/search-pro-quark | Quark (Alibaba) | E-commerce, lifestyle, образование | $0.0168/req |
Плюс возобновлённый прямой маршрут для zhipu/glm-4.5-air — экономичной GLM-чат-модели Zhipu по цене $0.15 input / $1.20 output per MTok, с siliconflow как primary и прозрачным fallback на zhipu-cn.
Почему важна оплата за запрос
Большинство RAG-стеков сегодня либо платят за токены tool-calling агенту в цикле, либо платят подписку SaaS поисковому API. Оплата за запрос — $0.0036 — $0.0168 за вызов — сводит обе модели к единому конверту chat-completion. Один HTTP-запрос, десять цитат на выходе, предсказуемый счёт.
Поскольку в ответе несутся url_citation аннотации с побайтно точными start_index / end_index в markdown body — нижестоящий код, уже умеющий разбирать OpenAI tool output или web-search цитаты у gpt-5 и claude-opus-4.7, подключается без переписывания.
Четыре движка — когда что выбирать
- search-std — дефолт для бюджетного grounding. Конверт идентичен другим, просто дешевле.
- search-pro — продакшн-grounding для RAG и answer-engines. Богаче сниппеты, поддерживает
search_recency_filter,search_domain_filter,content_size: high. - search-pro-sogou — лучший охват материкового Китая. Статьи WeChat, Baike, регуляторные и новостные источники, где сильна Sogou.
- search-pro-quark — индекс Quark от Alibaba. Иное ранжирование, чем у Sogou; силён в e-commerce, lifestyle, здоровье, образовании.
Конверт ответа
Результаты приходят одним chat.completion без token usage, но с per-request счётчиком:
{
"id": "20260520152358c6c4c87c07854a05",
"object": "chat.completion",
"created": 1779261839,
"model": "zhipu/search-pro",
"choices": [{
"index": 0,
"message": {
"role": "assistant",
"content": "- [Smith report](https://example.com/smith) — Findings published 2026.\n- [Jones analysis](https://example.com/jones) — Follow-up coverage.",
"annotations": [
{
"type": "url_citation",
"url_citation": {
"url": "https://example.com/smith",
"title": "Smith report",
"content": "Findings published 2026.",
"start_index": 0,
"end_index": 70
}
}
]
},
"finish_reason": "stop"
}],
"usage": {
"prompt_tokens": 0,
"completion_tokens": 0,
"total_tokens": 0,
"web_search_requests": 1
}
}message.content — это markdown-список с одной строкой на результат. Каждая строка отдельно экспонируется как url_citation аннотация с байтовым диапазоном. Стриминговые запросы получают один chunk + [DONE] терминатор (BigModel не отдаёт частичные результаты, и мы не имитируем это).
Переключение glm-4.5-air
Существующим пользователям zhipu/glm-4.5-air ничего менять не нужно. Мы подняли клиентскую цену до $0.15 / $1.20 per MTok (input/output) ради разумной маржи и добавили priority-1 fallback через прямой BigModel (zhipu-cn). Основной маршрут остался siliconflow-intl — failover прозрачный и автоматический.
Как начать
Один curl к OpenAI-совместимому endpoint TheRouter:
curl https://api.therouter.ai/v1/chat/completions \
-H "Authorization: Bearer $THE_ROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "zhipu/search-pro",
"messages": [{"role": "user", "content": "GLM-5 model release date"}]
}'Подробные руководства:
- Туториал по веб-поиску — cURL, Python, JS; параметры фильтров; сравнение движков
- Туториал по glm-4.5-air — когда выбирать, сравнение стоимости, схема маршрутизации
Или загляните в страницы моделей: