Назад к моделям

Qwen Flash

qwenqwen/qwen-flash

Сверхдешёвый тариф Qwen — большая скидка на оба направления.

qwen-flash — самый дешёвый коммерческий тариф Qwen в Bailian. Тот же OpenAI-совместимый API, то же окно 1M, но цена нацелена на массовую обработку — $0.07 input / $0.50 output per MTok.

Это правильный дефолт для фоновых задач и асинхронных пайплайнов: обогащение логов, предобработка embeddings, массовое переписывание — любая нагрузка, где стоимость считается на миллион запросов, а не на вызов.

Минимальная коммерческая цена
$0.07 input / $0.50 output per MTok — нижняя планка коммерческой линейки Qwen.
Контекст 1M сохранён
Та же поддержка длинного контекста, что у qwen-turbo / qwen-plus — для большинства задач разбиение не нужно.
Подходит для bulk
Спроектирована под высокий RPS пакетного трафика. Хороший дефолт для офлайн-пайплайнов.
Двухрегиональная маршрутизация
Селектор выбирает bailian-cn или bailian-sg по стоимости запроса.
Когда выбирать
Офлайн-пакеты, обогащение логов, массовое переписывание, теггинг, предобработка embeddings — там, где качество приемлемо, а ограничение — стоимость за миллион запросов.
Когда не выбирать
Пользовательский чат, где важно качество reasoning, сложный кодинг или задачи с измеримым бизнес-эффектом — используйте qwen-plus и выше.
Тарификация: $0.07 input / $0.50 output per MTok. TheRouter выбирает более дешёвый — bailian-cn или bailian-sg — на каждый запрос.
Размер контекста
1.0M
Максимальный вывод
33K
Цена Входза 1M токенов
$0.084за 1 млн токенов
Цена Выходза 1M токенов
$0.600за 1 млн токенов

Модальности

ТекстТекст

Разбивка цен

ТипСтавка
Вход$0.084 за 1 млн токенов
Выход$0.600 за 1 млн токенов

Поддерживаемые параметры

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop

Примеры API

Для новых интеграций используйте глобальный endpoint api.therouter.ai из примеров ниже; старый China accelerated endpoint выведен из эксплуатации.

cURL
curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "qwen/qwen-flash",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'
Поддержка