Назад к моделям

Qwen Plus

qwenqwen/qwen-plus

Средний уровень Qwen — режимы thinking / non-thinking и контекст 1M.

qwen-plus — рабочая лошадка коммерческой линейки Qwen3. Поддерживает два режима — быстрый `enable_thinking: false` для повседневного чата и более глубокий `enable_thinking: true`, который для сложных задач возвращает `reasoning_content` рядом с финальным ответом, — за долю цены флагмана.

Окно контекста 1M делает её сильным дефолтом для Q&A по длинным документам, чтения многофайлового кода и длинных диалогов агента. TheRouter на каждый запрос выбирает более дешёвый из bailian-cn / bailian-sg; `enable_thinking` и `reasoning_content` транзитятся в обе стороны без изменений.

Thinking + non-thinking
Переключайте `enable_thinking` на запрос. При значении true модель отдаёт `reasoning_content` рядом с финальным ответом.
Контекст 1M
Одно из самых больших коммерческих окон Qwen — идеально для целых документов и мультифайловых сценариев.
Сбалансированная цена
$0.50 input / $1.50 output per MTok. ~5× дешевле qwen-max на входе и ~5.3× — на выходе.
Двухрегиональная маршрутизация
Селектор на каждый запрос выбирает более дешёвый регион — bailian-cn или bailian-sg — без региональной логики на клиенте.
Когда выбирать
Дефолтная Qwen-модель в проде: Q&A по длинным документам, многошаговые агенты, чтение кода и чат, где нужен опциональный глубокий reasoning без флагманского ценника.
Когда не выбирать
Если нужен топ Qwen по reasoning или кодингу — поднимайтесь до qwen3-max / qwen3-coder-plus. Для высокопроизводительного дешёвого чата — qwen-turbo или qwen-flash.
Тарификация: $0.50 input / $1.50 output per MTok. TheRouter выбирает более дешёвый из bailian-cn / bailian-sg на каждый запрос. Режим thinking цену не меняет.
Размер контекста
1.0M
Максимальный вывод
33K
Цена Входза 1M токенов
$0.600за 1 млн токенов
Цена Выходза 1M токенов
$1.80за 1 млн токенов

Модальности

ТекстТекст

Разбивка цен

ТипСтавка
Вход$0.600 за 1 млн токенов
Выход$1.80 за 1 млн токенов

Поддерживаемые параметры

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatreasoningstop

Примеры API

Для новых интеграций используйте глобальный endpoint api.therouter.ai из примеров ниже; старый China accelerated endpoint выведен из эксплуатации.

cURL
curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen-plus",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'
Поддержка