·Запуск·English →·中文版本 →

Zhipu Web Search и GLM-4.5-Air теперь доступны в TheRouter

На TheRouter появились пять маршрутов Zhipu BigModel — четыре поисковых движка с цитированием и экономичная чат-модель zhipu/glm-4.5-air. Все маршруты OpenAI-совместимы, обычно достаточно изменить один параметр endpoint.


Что запустили

Четыре оплачиваемых за запрос поисковых движка. Каждый возвращает до десяти ранжированных страниц с заголовком, URL и фрагментом контента, обёрнутых в OpenAI chat.completion с url_citation аннотациями:

МодельДвижокЛучше дляЦена
zhipu/search-stdBigModel общийСамый дешёвый grounding$0.0036/req
zhipu/search-proBigModel флагманБогаче сниппеты, фильтры$0.0108/req
zhipu/search-pro-sogouИндекс SogouКитайские новости, WeChat, Baike$0.0168/req
zhipu/search-pro-quarkQuark (Alibaba)E-commerce, lifestyle, образование$0.0168/req

Плюс возобновлённый прямой маршрут для zhipu/glm-4.5-air — экономичной GLM-чат-модели Zhipu по цене $0.15 input / $1.20 output per MTok, с siliconflow как primary и прозрачным fallback на zhipu-cn.

Почему важна оплата за запрос

Большинство RAG-стеков сегодня либо платят за токены tool-calling агенту в цикле, либо платят подписку SaaS поисковому API. Оплата за запрос — $0.0036 — $0.0168 за вызов — сводит обе модели к единому конверту chat-completion. Один HTTP-запрос, десять цитат на выходе, предсказуемый счёт.

Поскольку в ответе несутся url_citation аннотации с побайтно точными start_index / end_index в markdown body — нижестоящий код, уже умеющий разбирать OpenAI tool output или web-search цитаты у gpt-5 и claude-opus-4.7, подключается без переписывания.

Четыре движка — когда что выбирать

  • search-std — дефолт для бюджетного grounding. Конверт идентичен другим, просто дешевле.
  • search-pro — продакшн-grounding для RAG и answer-engines. Богаче сниппеты, поддерживает search_recency_filter, search_domain_filter, content_size: high.
  • search-pro-sogou — лучший охват материкового Китая. Статьи WeChat, Baike, регуляторные и новостные источники, где сильна Sogou.
  • search-pro-quark — индекс Quark от Alibaba. Иное ранжирование, чем у Sogou; силён в e-commerce, lifestyle, здоровье, образовании.

Конверт ответа

Результаты приходят одним chat.completion без token usage, но с per-request счётчиком:

{
  "id": "20260520152358c6c4c87c07854a05",
  "object": "chat.completion",
  "created": 1779261839,
  "model": "zhipu/search-pro",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "- [Smith report](https://example.com/smith) — Findings published 2026.\n- [Jones analysis](https://example.com/jones) — Follow-up coverage.",
      "annotations": [
        {
          "type": "url_citation",
          "url_citation": {
            "url": "https://example.com/smith",
            "title": "Smith report",
            "content": "Findings published 2026.",
            "start_index": 0,
            "end_index": 70
          }
        }
      ]
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 0,
    "completion_tokens": 0,
    "total_tokens": 0,
    "web_search_requests": 1
  }
}

message.content — это markdown-список с одной строкой на результат. Каждая строка отдельно экспонируется как url_citation аннотация с байтовым диапазоном. Стриминговые запросы получают один chunk + [DONE] терминатор (BigModel не отдаёт частичные результаты, и мы не имитируем это).

Переключение glm-4.5-air

Существующим пользователям zhipu/glm-4.5-air ничего менять не нужно. Мы подняли клиентскую цену до $0.15 / $1.20 per MTok (input/output) ради разумной маржи и добавили priority-1 fallback через прямой BigModel (zhipu-cn). Основной маршрут остался siliconflow-intl — failover прозрачный и автоматический.

Как начать

Один curl к OpenAI-совместимому endpoint TheRouter:

curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THE_ROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "zhipu/search-pro",
    "messages": [{"role": "user", "content": "GLM-5 model release date"}]
  }'

Подробные руководства:

Или загляните в страницы моделей:

Поддержка