Назад к моделям

Nemotron Super 120B

nvidianvidia/nemotron-super-120b

NVIDIA's hybrid LatentMoE model (120B total, 12B active). Mamba-2 + Attention + MoE architecture with 1M context. Multi-Token Prediction for fast inference.

Размер контекста
1M
Максимальный вывод
262K
Цена Входза 1M токенов
$0.240за 1 млн токенов
Цена Выходза 1M токенов
$1.02за 1 млн токенов

Модальности

ТекстТекст

Разбивка цен

ТипСтавка
Вход$0.240 за 1 млн токенов
Выход$1.02 за 1 млн токенов

Поддерживаемые параметры

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop

Примеры API

Для новых интеграций используйте глобальный endpoint api.therouter.ai из примеров ниже; старый China accelerated endpoint выведен из эксплуатации.

cURL
curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "nvidia/nemotron-super-120b",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'
Поддержка