Nemotron Nano 30B

nvidianvidia/nemotron-nano-30b

NVIDIA's efficient hybrid model (30B total, 3.5B active MoE). Mamba-2 + Attention layers with 1M context for edge deployment.

Размер контекста

Максимальный вывод

262K

Цена Входза 1M токенов

$0.072за 1 млн токенов

Цена Выходза 1M токенов

$0.288за 1 млн токенов

Модальности

Текст→Текст

Разбивка цен

Тип	Ставка
Вход	$0.072 за 1 млн токенов
Выход	$0.288 за 1 млн токенов

Поддерживаемые параметры

temperaturemax_tokenstop_ptoolstool_choiceresponse_formatstop

Примеры API

Для новых интеграций используйте глобальный endpoint api.therouter.ai из примеров ниже; старый China accelerated endpoint выведен из эксплуатации.

cURL

curl https://api.therouter.ai/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $THE_ROUTER_API_KEY"   -d '{
    "model": "nvidia/nemotron-nano-30b",
    "messages": [
      {"role": "user", "content": "Summarize the key points from this input."}
    ]
  }'