Модели

Как выбирать модели в TheRouter.ai

Используйте live-каталог ниже и endpoint /v1/models, чтобы копировать точные model IDs. Русская локализация не добавляет новые provider routes и не обещает отдельную доступность моделей.

Для первого запроса возьмите model ID из текущего каталога или из quickstart. Если модель отсутствует в /v1/models, не используйте ее в Cursor, Claude Code или OpenAI SDK.
Перейти к русскому quickstart →

Модели и цены

Сравнивайте доступные модели по цене, размеру контекста, провайдерам и возможностям до того, как направлять на них трафик.

Бренд
Выберите бренды
Типы входа
Контекст
Показано 242 из 242 моделей
Amazon Nova 2 Lite
amazon/nova-2-lite

Nova 2 Lite is an advanced multimodal reasoning model with 1M context. Dynamically adjusts reasoning depth. Extended thinking on complex problems.

amazon
Контекст
1M
Макс. вывод
65K
Цена
Вход$0.180за 1 млн токенов
Выход$0.720за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
Amazon Nova Lite
amazon/nova-lite

Nova Lite is a multimodal understanding model. Multilingual with reasoning over text, images, and videos. Cost-effective for everyday tasks.

amazon
Контекст
300K
Макс. вывод
5K
Цена
Вход$0.072за 1 млн токенов
Выход$0.288за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Amazon Nova Micro
amazon/nova-micro

Amazon's fastest and most cost-effective text-only model. Ideal for high-throughput, low-latency tasks.

amazon
Контекст
128K
Макс. вывод
5K
Цена
Вход$0.042за 1 млн токенов
Выход$0.168за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Amazon Nova Premier
amazon/nova-premier

Amazon's most capable multimodal model for complex reasoning tasks. Best teacher for distilling custom models. Supports text, images, and videos.

amazon
Контекст
1M
Макс. вывод
5K
Цена
Вход$3.00за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Amazon Nova Pro
amazon/nova-pro

Amazon Nova Pro is a multimodal understanding model. Multilingual with reasoning over text, images, and videos.

amazon
Контекст
300K
Макс. вывод
5K
Цена
Вход$0.960за 1 млн токенов
Выход$3.84за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Amazon Titan Text Embeddings V2
amazon/titan-embed-v2

Lightweight, efficient embedding model for high accuracy retrieval tasks. Supports flexible embedding sizes (1024, 512, 256) and 100+ languages.

amazon
Контекст
8K
Макс. вывод
--
Цена
Вход$0.024за 1 млн токенов
Вход → Выход
Текстembedding
2 параметров
chatgpt-image-latest
openai/chatgpt-image-latest

Image model used in ChatGPT.

openai
Контекст
--
Макс. вывод
--
Цена
Изображение$0.0408за изображение
Вход$6.00за 1 млн токенов
Вход → Выход
ТекстИзображениеИзображение
7 параметровещё 5 цен
Claude Haiku 4.5
anthropic/claude-haiku-4.5

Claude Haiku 4.5 delivers near-frontier performance for a wide range of use cases, and stands out as one of the best coding and agent models–with the right speed and cost to power free products and high-volume user experiences. Use cases: Powering free tier user experiences: Claude Haiku 4.5 delivers near-frontier performance at a cost and speed that makes powering free agent products and agentic use cases economically viable at scale. Real-time experiences: Claude Haiku 4.5's speed is ideal for real-time applications like customer service agents and chatbots where response time is critical. Coding sub-agents: Use Claude Haiku 4.5 to power sub-agents, enabling multi-agent systems that tackle complex refactors, migrations, and large feature builds with quality and speed. Financial sub-agents: Use Claude Haiku 4.5 to monitor thousands of data streams—tracking regulatory changes, market signals, and portfolio risks to preemptively adapt compliance and trading systems at previously impossible scales. Research sub-agents: Perform parallel analyses across multiple data sources while maintaining fast response times. Ideal for rapid business intelligence, competitive analysis, and real-time decision support. Business tasks: Claude Haiku 4.5 is capable of producing and editing office files like slides, documents, and spreadsheets. It also better supports strategy and campaign planning, business analysis and brainstorming.

anthropic
Контекст
200K
Макс. вывод
8K
Цена
Вход$1.20за 1 млн токенов
Выход$6.00за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
7 параметров
Claude Opus 4
anthropic/claude-opus-4

Claude Opus 4 is Anthropic's most intelligent model and is state-of-the-art for coding and agent capabilities, especially agentic search. It excels for customers needing frontier intelligence: Advanced coding: Independently plan and execute complex development tasks end-to-end. It adapts to your style and maintains high code quality throughout. AI agents: Enable agents to tackle complex, multi-step tasks that require peak accuracy. Agentic search and research: Connect to multiple data sources to synthesize comprehensive insights across repositories. Long-horizon tasks and complex problem solving (virtual collaborator): Unlock new use cases involving long-horizon tasks that require memory, sustained reasoning, and long chains of actions. Content creation: Create human-quality content with natural prose. Produce long-form creative content, technical documentation, marketing copy, and frontend design mockups.

anthropic
Контекст
200K
Макс. вывод
32K
Цена
Вход$18.00за 1 млн токенов
Выход$90.00за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
8 параметров
Claude Opus 4.1
anthropic/claude-opus-4.1

Claude Opus 4.1 is Anthropic's most intelligent model and an industry leader for coding and agent capabilities, especially agentic search. It excels for customers needing frontier intelligence: Advanced coding: Independently plan and execute complex development tasks end-to-end. It adapts to your style, thoughtfully plans and pivots, and maintains high code quality throughout. Long-horizon tasks and complex problem solving (virtual collaborator): Unlock new use cases involving long-horizon tasks that require memory, sustained reasoning, and long chains of actions. AI agents: Enable agents to tackle complex, multi-step tasks that require peak accuracy. Agentic search and research: Connect to multiple data sources to synthesize comprehensive insights across repositories. Content creation: Create human-quality content with natural prose. Produce long-form creative content, technical documentation, marketing copy, and frontend design mockups. Memory and context management: Incorporates memory capabilities that allow it to effectively summarize and reference previous interactions.

anthropic
Контекст
200K
Макс. вывод
32K
Цена
Вход$18.00за 1 млн токенов
Выход$90.00за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
8 параметров
Claude Opus 4.5
anthropic/claude-opus-4.5

The next generation of Anthropic's most intelligent model, Claude Opus 4.5 is an industry leader across coding, agents, computer use, and enterprise workflows. Use cases: Coding: Opus 4.5 can confidently deliver multi-day software development projects in hours, working independently with the technical depth and taste to create efficient and straightforward solutions. It has improved performance across coding languages, with better planning and architecture choices - making it the ideal model for enterprise developers. Agents: Claude Opus 4.5, paired with our advanced tool use capabilities, enables more capable agents with new behaviors. Computer use: Our best computer-using model yet, Claude Opus 4.5 navigates new experiences with confident, consistent approaches that deliver more human-like browsing, enabling better web QA, workflow automation, and advanced user experiences. Enterprise workflows: Opus 4.5 can power agents that manage sprawling professional projects from start to finish. It better leverages memory to maintain context and consistency across files, alongside a step-change improvement in creating spreadsheets, slides, and docs. Financial analysis: Opus 4.5 connects the dots across complex information systems - regulatory filings, market reports, internal data - making sophisticated predictive modeling and proactive compliance possible. Cybersecurity: Opus 4.5 brings professional-grade analysis to security workflows, correlating logs, vulnerability databases, and threat intelligence for proactive threat detection and automated incident response.

anthropic
Контекст
200K
Макс. вывод
64K
Цена
Вход$6.00за 1 млн токенов
Выход$30.00за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
8 параметров
Claude Opus 4.6
anthropic/claude-opus-4.6

Claude Opus 4.6 is the next generation of our most intelligent model, and the world's best model for coding, enterprise agents, and professional work. Use cases include: Agents: Opus 4.6 is the world's best model for agentic workflows, orchestrating complex tasks across dozens of tools with industry-leading reliability. It proactively spins up subagents, parallelizes work, and drives tasks forward with minimal oversight. Coding: Opus 4.6 is the world's best coding model, excelling at long-horizon projects, complex implementations, and large-scale codebases. It handles the full lifecycle from architecture to deployment—so senior engineers can delegate their most complex work with confidence. Enterprise workflows: Opus 4.6 sets the standard for enterprise workflows, powering agents that manage sprawling projects end-to-end with professional polish, domain awareness, and industry-leading performance on spreadsheets, slides, and docs. Financial analysis: Opus 4.6 is Anthropic's most capable model for financial workflows, surfacing insights that would take analysts days to compile. It handles the nuance and precision that compliance-sensitive work demands. Cybersecurity: Opus 4.6 delivers the deepest reasoning for security workflows, catching subtle patterns and complex attack vectors with unmatched accuracy. Computer use: Opus 4.6 is our most capable computer-use model for complex workflows, bringing deep reasoning to multi-step tasks that span multiple applications and require planning and judgment.

anthropic
Контекст
1M
Макс. вывод
128K
Цена
Вход$6.00за 1 млн токенов
Выход$30.00за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
8 параметров
Claude Opus 4.7
anthropic/claude-opus-4.7

Claude Opus 4.7 is Anthropic's most capable model — 13% coding lift over Opus 4.6, tripled image resolution (2576px / 3.75 MP), new xhigh effort level, and task budgets for autonomous agent loops. Best for coding, agents, enterprise workflows, cybersecurity, and financial analysis.

anthropic
Контекст
1M
Макс. вывод
128K
Цена
Вход$6.00за 1 млн токенов
Выход$30.00за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
8 параметров
Claude Sonnet 4
anthropic/claude-sonnet-4

Claude Sonnet 4 balances impressive performance for coding with the right speed and cost for high-volume use cases: Coding: Handle everyday development tasks with enhanced performance-power code reviews, bug fixes, API integrations, and feature development with immediate feedback loops. AI Assistants: Power production-ready assistants for real-time applications—from customer support automation to operational workflows that require both intelligence and speed. Efficient research: Perform focused analysis across multiple data sources while maintaining fast response times. Ideal for rapid business intelligence, competitive analysis, and real-time decision support. Large-scale content: Generate and analyze content at scale with improved quality. Create customer communications, analyze user feedback, and produce marketing materials with the right balance of quality and throughput.

anthropic
Контекст
1M
Макс. вывод
64K
Цена
Вход$3.60за 1 млн токенов
Выход$18.00за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
8 параметров
Claude Sonnet 4.5
anthropic/claude-sonnet-4.5

Claude Sonnet 4.5 is our most capable model to date for building real-world agents and handling complex, long-horizon tasks–balancing the right speed and cost for high-volume use cases: Long-running agents: Power production-ready assistants for multi-step, real-time applications—from customer support automation to complex operational workflows that require peak accuracy, intelligence, and speed. Coding: Handle everyday development tasks with enhanced performance––or plan and execute complex software projects spanning hours or days––with the ability to save, maintain, and reference information across multiple sessions. Cybersecurity: Deploy agents that autonomously patch vulnerabilities before exploitation––shifting from reactive detection to proactive defense. Financial analysis: Conduct entry-level financial analysis, deliver advanced predictive analysis, or preemptively develop intelligent risk management strategies that leverage best-in-class domain knowledge. Computer use: Claude Sonnet 4.5 is our most accurate model for computer use, enabling developers to direct Claude to use computers the way people do. Research: Perform focused analysis across multiple data sources, turning expert analysis into final deliverables. Ideal for complex problem solving, rapid business intelligence, and real-time decision support.

anthropic
Контекст
1M
Макс. вывод
64K
Цена
Вход$3.60за 1 млн токенов
Выход$18.00за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
8 параметров
Claude Sonnet 4.6
anthropic/claude-sonnet-4.6

Claude Sonnet 4.6 delivers frontier intelligence at scale—built for coding, agents, and enterprise workflows.

anthropic
Контекст
1M
Макс. вывод
64K
Цена
Вход$3.60за 1 млн токенов
Выход$18.00за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
8 параметров
Codestral
mistral/codestral

Mistral's specialized coding model. Optimized for code generation, completion, and analysis.

mistral
Контекст
256K
Макс. вывод
16K
Цена
Вход$0.360за 1 млн токенов
Выход$1.08за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
CogVideoX 3
zhipu/cogvideox-3

Zhipu AI CogVideoX 3 — flagship text/image-to-video generation. Up to 5s or 10s, up to 4K resolution.

zhipu
Контекст
--
Макс. вывод
--
Цена
Запрос$0.2088за запрос
Вход → Выход
ТекстИзображениеВидео
7 параметров
CogVideoX Flash
zhipu/cogvideox-flash

Zhipu AI CogVideoX Flash — free-tier text/image-to-video generation.

zhipu
Контекст
--
Макс. вывод
--
Цена
--
Вход → Выход
ТекстИзображениеВидео
7 параметров
CogView 3 Flash
zhipu/cogview-3-flash

Zhipu AI CogView 3 Flash — free-tier text-to-image generation for trial and low-volume use.

zhipu
Контекст
--
Макс. вывод
--
Цена
Per image--за изображение
Вход → Выход
ТекстИзображение
4 параметров
CogView 4
zhipu/cogview-4

Zhipu AI CogView 4 — text-to-image generation with strong bilingual prompt understanding.

zhipu
Контекст
--
Макс. вывод
--
Цена
Запрос$0.010за запрос
Изображение$0.0125за изображение
Вход → Выход
ТекстИзображение
5 параметровещё 1 цен
Cohere Embed V4
cohere/embed-v4

Multilingual multimodal embedding model capable of transforming images, texts, and interleaved content into vector representations. State-of-the-art performance with byte/binary quantization and matryoshka embeddings for compression.

cohere
Контекст
8K
Макс. вывод
--
Цена
Вход$0.120за 1 млн токенов
Вход → Выход
ТекстИзображениеembedding
3 параметров
Command A
cohere/command-a

Cohere's most capable model for complex enterprise tasks, RAG, and multi-step reasoning.

cohere
Контекст
256K
Макс. вывод
16K
Цена
Вход$3.00за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
Command R+
cohere/command-r-plus

Cohere's large model optimized for RAG and enterprise workflows.

cohere
Контекст
128K
Макс. вывод
4K
Цена
Вход$3.00за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
CosyVoice2-0.5B
alibaba/cosyvoice2-0.5b

Alibaba's multilingual TTS model with natural prosody and voice cloning support.

alibaba
Контекст
--
Макс. вывод
--
Цена
Запрос$8.58за запрос
Вход → Выход
ТекстАудио
6 параметров
DeepSeek R1
deepseek/deepseek-r1

DeepSeek R1 (671B total, 37B active MoE) is a reasoning model that uses chain-of-thought with <think> tags to solve complex problems. Excels at math, coding, and scientific reasoning tasks with transparent step-by-step thinking.

deepseek
Контекст
128K
Макс. вывод
33K
Цена
Вход$2.10за 1 млн токенов
Выход$8.40за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
DeepSeek V3.1
deepseek/deepseek-v3.1

DeepSeek V3.1 is a hybrid model supporting both thinking and non-thinking modes. Features enhanced tool calling capabilities for agent-based tasks. Thinking mode maintains answer quality comparable to DeepSeek-R1 with improved response times.

deepseek
Контекст
128K
Макс. вывод
33K
Цена
Вход$0.900за 1 млн токенов
Выход$2.64за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
DeepSeek V3.1 Terminus
deepseek/deepseek-v3.1-terminus

DeepSeek V3.1 Terminus — refined variant of V3.1 optimized for tool calling and structured generation tasks.

deepseek
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.480за 1 млн токенов
Выход$1.74за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
DeepSeek V3.2
deepseek/deepseek-v3.2

DeepSeek V3.2 (685B total, 37B active MoE) harmonizes high computational efficiency with superior reasoning and agent performance. Features DeepSeek Sparse Attention for long-context efficiency and a scalable reinforcement learning framework. Excels at long-context reasoning, tool-using agents, function calling, JSON output, and FIM.

deepseek
Контекст
128K
Макс. вывод
33K
Цена
Вход$0.960за 1 млн токенов
Выход$2.88за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
DeepSeek V3.2 Exp
deepseek/deepseek-v3.2-exp

DeepSeek V3.2 Exp — experimental variant of V3.2 with enhanced general-purpose capabilities. Strong at tool use, structured output, and multi-turn conversation.

deepseek
Контекст
131K
Макс. вывод
16K
Цена
Вход$0.480за 1 млн токенов
Выход$0.720за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
DeepSeek V4 Flash
deepseek/deepseek-v4-flash

DeepSeek V4 Flash — fast, cost-efficient model with 1M context window. Supports reasoning, tool calling, and structured output.

deepseek
Контекст
1M
Макс. вывод
384K
Цена
Вход$0.240за 1 млн токенов
Выход$0.480за 1 млн токенов
Вход → Выход
ТекстТекст
12 параметров
DeepSeek V4 Pro
deepseek/deepseek-v4-pro

DeepSeek V4 Pro — high-capability model with 1M context window. Superior reasoning, coding, and agent performance with tool calling and structured output.

deepseek
Контекст
1M
Макс. вывод
384K
Цена
Вход$3.00за 1 млн токенов
Выход$6.00за 1 млн токенов
Вход → Выход
ТекстТекст
12 параметров
Devstral 2
mistral/devstral-2

Mistral's specialized coding model (123B parameters). Optimized for code generation, analysis, and software engineering tasks.

mistral
Контекст
128K
Макс. вывод
16K
Цена
Вход$0.660за 1 млн токенов
Выход$3.12за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Doubao 1.5 Lite 32k
doubao/doubao-1-5-lite-32k

Doubao 1.5 Lite (32k context) — cost-efficient ByteDance chat model for high-volume routine tasks.

doubao
Контекст
33K
Макс. вывод
16K
Цена
Вход$0.050за 1 млн токенов
Выход$0.100за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Doubao 1.5 Pro 32k
doubao/doubao-1-5-pro-32k

Doubao 1.5 Pro — ByteDance flagship general-purpose chat model with tools and JSON mode.

doubao
Контекст
33K
Макс. вывод
16K
Цена
Вход$0.1333за 1 млн токенов
Выход$0.3334за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Doubao 1.5 Vision Pro 32k
doubao/doubao-1-5-vision-pro-32k

Doubao 1.5 Vision Pro (32k context) — extended-context vision-language variant.

doubao
Контекст
33K
Макс. вывод
16K
Цена
Вход$0.500за 1 млн токенов
Выход$1.50за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Doubao Seed 1.6
doubao/doubao-seed-1-6

Doubao Seed 1.6 — ByteDance Seed-series next-gen general model with tools and structured output.

doubao
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.1333за 1 млн токенов
Выход$1.33за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Doubao Seed 1.6 Flash
doubao/doubao-seed-1-6-flash

Doubao Seed 1.6 Flash — ultra-low-latency variant of Seed 1.6, ideal for chat and agent loops.

doubao
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.025за 1 млн токенов
Выход$0.250за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Doubao Seed 1.6 Vision
doubao/doubao-seed-1-6-vision

Doubao Seed 1.6 Vision — vision-language Seed 1.6 variant for multimodal understanding.

doubao
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.1333за 1 млн токенов
Выход$1.33за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Doubao Seed 1.8
doubao/doubao-seed-1-8

Doubao Seed 1.8 — incremental upgrade of Seed 1.6 with improved tool-call reliability.

doubao
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.1333за 1 млн токенов
Выход$1.33за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Doubao Seed 2.0 Code
doubao/doubao-seed-2-0-code

Doubao Seed 2.0 Code — coding-specialized Seed 2.0 model for code generation, refactor, and review.

doubao
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.5333за 1 млн токенов
Выход$2.67за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Doubao Seed 2.0 Lite
doubao/doubao-seed-2-0-lite

Doubao Seed 2.0 Lite — cost-efficient Seed 2.0 variant.

doubao
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.100за 1 млн токенов
Выход$0.600за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Doubao Seed 2.0 Mini
doubao/doubao-seed-2-0-mini

Doubao Seed 2.0 Mini — smallest Seed 2.0 variant for high-QPS edge use cases.

doubao
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.0334за 1 млн токенов
Выход$0.3334за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Doubao Seed 2.0 Pro
doubao/doubao-seed-2-0-pro

Doubao Seed 2.0 Pro — flagship Seed 2.0 model with strongest reasoning and tool use.

doubao
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.5333за 1 млн токенов
Выход$2.67за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Doubao Seed Character
doubao/doubao-seed-character

Doubao Seed Character — roleplay / persona-driven chat model.

doubao
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.1333за 1 млн токенов
Выход$0.3334за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Doubao Seed Code
doubao/doubao-seed-code

Doubao Seed Code — code generation and code understanding model.

doubao
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.200за 1 млн токенов
Выход$1.33за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Doubao Seedance 2.0
doubao/doubao-seedance-2-0

Doubao SeedDance 2.0 — text/image-to-video generation, flagship quality tier.

doubao
Контекст
--
Макс. вывод
--
Цена
Запрос$4.67за запрос
Выход$4.67за 1 млн токенов
Вход → Выход
ТекстИзображениеВидео
5 параметров
Doubao Seedance 2.0 Fast
doubao/doubao-seedance-2-0-fast

Doubao SeedDance 2.0 Fast — faster, lower-cost variant of SeedDance 2.0 for iterative video drafting.

doubao
Контекст
--
Макс. вывод
--
Цена
Запрос$3.67за запрос
Выход$3.67за 1 млн токенов
Вход → Выход
ТекстИзображениеВидео
5 параметров
Doubao Seedream 4.5
doubao/doubao-seedream-4-5

Doubao SeedDream 4.5 — text/image-to-image generation, Chinese-bilingual prompt support.

doubao
Контекст
--
Макс. вывод
--
Цена
Запрос$0.0416за запрос
Вход → Выход
ТекстИзображениеИзображение
5 параметров
Doubao Seedream 5.0
doubao/doubao-seedream-5-0

Doubao SeedDream 5.0 — latest text/image-to-image generation with improved fidelity.

doubao
Контекст
--
Макс. вывод
--
Цена
Запрос$0.0367за запрос
Вход → Выход
ТекстИзображениеИзображение
5 параметров
Embedding 2
zhipu/embedding-2

Zhipu AI Embedding 2 — text embedding model with fixed 1024-dim output.

zhipu
Контекст
512
Макс. вывод
--
Цена
Вход$0.120за 1 млн токенов
Вход → Выход
Текстembedding
3 параметров
Embedding 3
zhipu/embedding-3

Zhipu AI Embedding 3 — latest text embedding model. Default 2048-dim, supports custom dimensions (256, 512, 1024, 2048).

zhipu
Контекст
3K
Макс. вывод
--
Цена
Вход$0.120за 1 млн токенов
Вход → Выход
Текстembedding
4 параметров
ERNIE 4.5
baidu/ernie-4.5

Baidu ERNIE 4.5 (300B MoE, 47B active) — Baidu's flagship model with strong Chinese language understanding.

baidu
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.468за 1 млн токенов
Выход$1.85за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
Fish Speech 1.5
fishaudio/fish-speech-1.5

Fish Audio's TTS model optimized for Chinese and English speech synthesis.

fishaudio
Контекст
--
Макс. вывод
--
Цена
Запрос$8.58за запрос
Вход → Выход
ТекстАудио
4 параметров
FLUX.1 Kontext Dev
black-forest-labs/flux-kontext-dev

Open-weight 12B variant of FLUX.1 Kontext. Cheapest entry point for image editing. Routed via SiliconFlow.

black-forest-labs
Контекст
--
Макс. вывод
--
Цена
Изображение$0.018за изображение
Вход$0.0168за 1 млн токенов
Вход → Выход
ТекстИзображениеИзображение
4 параметровещё 1 цен
FLUX.1 Kontext Max
black-forest-labs/flux-kontext-max

Highest-quality FLUX.1 Kontext variant. Slower than Pro but yields the best edit fidelity. Routed via SiliconFlow.

black-forest-labs
Контекст
--
Макс. вывод
--
Цена
Изображение$0.096за изображение
Вход$0.096за 1 млн токенов
Вход → Выход
ТекстИзображениеИзображение
7 параметровещё 1 цен
FLUX.1 Kontext Pro
black-forest-labs/flux-kontext-pro

Black Forest Labs' image-edit model. 12B parameters, flow-matching diffusion transformer. Edits an input image based on a text instruction while preserving composition. Routed via SiliconFlow.

black-forest-labs
Контекст
--
Макс. вывод
--
Цена
Изображение$0.048за изображение
Вход$0.048за 1 млн токенов
Вход → Выход
ТекстИзображениеИзображение
7 параметровещё 1 цен
Gemini 2.0 Flash
google/gemini-2.0-flash-001

Workhorse model for all daily tasks. Strong overall performance and low latency supports real-time applications. Suitable for chat interactions, content generation, and general-purpose AI tasks.

google
Контекст
1.0M
Макс. вывод
8K
Цена
Вход$0.180за 1 млн токенов
Выход$0.720за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
7 параметров
Gemini 2.0 Flash Lite
google/gemini-2.0-flash-lite

Google's cost-effective Gemini model to support high throughput. Optimized for the most price-sensitive use cases while maintaining solid quality for everyday tasks.

google
Контекст
1.0M
Макс. вывод
8K
Цена
Вход$0.090за 1 млн токенов
Выход$0.360за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
7 параметров
Gemini 2.5 Flash
google/gemini-2.5-flash

Best for balancing reasoning and speed. Gemini 2.5 Flash offers thinking capabilities with strong performance across coding, math, and reasoning tasks at an efficient price point.

google
Контекст
1.0M
Макс. вывод
66K
Цена
Вход$0.360за 1 млн токенов
Выход$3.00за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
7 параметров
Gemini 2.5 Flash Lite
google/gemini-2.5-flash-lite

Most balanced Gemini model for low latency use cases. Optimized for high-volume, cost-sensitive workloads with strong quality at minimal cost.

google
Контекст
1.0M
Макс. вывод
66K
Цена
Вход$0.120за 1 млн токенов
Выход$0.480за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
7 параметров
Gemini 2.5 Pro
google/gemini-2.5-pro

Strongest Gemini model quality, especially for code and complex prompts. Features advanced reasoning with thinking capabilities and excels at multi-step problem solving, code generation, and mathematical reasoning.

google
Контекст
1.0M
Макс. вывод
66K
Цена
Вход$1.50за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
7 параметров
Gemma 2 9B IT
google/gemma-2-9b-it

Google's Gemma 2 9B instruction-tuned model. Lightweight and efficient for basic tasks.

google
Контекст
8K
Макс. вывод
4K
Цена
Вход$0.360за 1 млн токенов
Выход$0.360за 1 млн токенов
Вход → Выход
ТекстТекст
4 параметров
Gemma 3 12B
google/gemma-3-12b

Google's open-source Gemma 3 12B model with vision. Efficient and fast for everyday tasks.

google
Контекст
128K
Макс. вывод
8K
Цена
Вход$0.144за 1 млн токенов
Выход$0.456за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
4 параметров
Gemma 3 27B
google/gemma-3-27b

Google's open-source Gemma 3 27B model. Strong performance with vision capabilities in a compact package.

google
Контекст
128K
Макс. вывод
8K
Цена
Вход$0.360за 1 млн токенов
Выход$0.600за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
4 параметров
Gemma 3 4B
google/gemma-3-4b

Google's smallest Gemma 3 model at 4B parameters. Lightweight chat, copilots, coding and reasoning, cost-effective fine-tuned vertical assistants.

google
Контекст
128K
Макс. вывод
8K
Цена
Вход$0.060за 1 млн токенов
Выход$0.120за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
4 параметров
Gemma 4 26B (MoE)
google/gemma-4-26b-moe

Google's Gemma 4 26B Mixture-of-Experts model with 4B active parameters per token — open weights under Apache 2.0. Ranks #6 on the open Arena leaderboard. Multimodal text + image input.

google
Контекст
128K
Макс. вывод
8K
Цена
Вход$0.240за 1 млн токенов
Выход$0.480за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
4 параметров
Gemma 4 31B
google/gemma-4-31b

Google's Gemma 4 31B dense model — open weights under Apache 2.0, ranks #3 on the open Arena leaderboard. Multimodal text + image input. Released April 2026.

google
Контекст
128K
Макс. вывод
8K
Цена
Вход$0.360за 1 млн токенов
Выход$0.600за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
4 параметров
GLM 4.1V Thinking Flash
zhipu/glm-4.1v-thinking-flash

Zhipu AI GLM 4.1V Thinking Flash — free-tier always-on chain-of-thought vision model supporting image and video inputs.

zhipu
Контекст
66K
Макс. вывод
16K
Цена
--
Вход → Выход
ТекстИзображениеВидеоТекст
4 параметров
GLM 4.1V Thinking FlashX
zhipu/glm-4.1v-thinking-flashx

Zhipu AI GLM 4.1V Thinking FlashX — always-on chain-of-thought vision model supporting image and video inputs for complex visual reasoning.

zhipu
Контекст
66K
Макс. вывод
16K
Цена
Вход$0.480за 1 млн токенов
Выход$0.480за 1 млн токенов
Вход → Выход
ТекстИзображениеВидеоТекст
4 параметров
GLM 4.5 Air
zhipu/glm-4.5-air

Zhipu AI GLM 4.5 Air — lightweight mixture-of-experts model tuned for agent workloads and high-throughput inference.

zhipu
Контекст
131K
Макс. вывод
66K
Цена
Вход$0.180за 1 млн токенов
Выход$1.44за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
GLM 4.5V
zhipu/glm-4.5v

Zhipu AI GLM 4.5V — vision-language model supporting image, video, and document understanding. No function-call support.

zhipu
Контекст
66K
Макс. вывод
16K
Цена
Вход$0.960за 1 млн токенов
Выход$2.88за 1 млн токенов
Вход → Выход
ТекстИзображениеВидеоPDFТекст
4 параметров
GLM 4.6
zhipu/glm-4.6

Zhipu AI GLM 4.6 — mid-range model balancing capability and cost.

zhipu
Контекст
131K
Макс. вывод
66K
Цена
Вход$0.336за 1 млн токенов
Выход$1.68за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
GLM 4.6V
zhipu/glm-4.6v

Zhipu AI GLM 4.6V — vision-capable mid-range model for image, video, and document understanding with native function calling.

zhipu
Контекст
131K
Макс. вывод
66K
Цена
Вход$0.336за 1 млн токенов
Выход$1.68за 1 млн токенов
Вход → Выход
ТекстИзображениеВидеоPDFТекст
6 параметров
GLM 4.6V Flash
zhipu/glm-4.6v-flash

Zhipu AI GLM 4.6V Flash — free-tier vision model supporting image, video, and document understanding.

zhipu
Контекст
131K
Макс. вывод
16K
Цена
--
Вход → Выход
ТекстИзображениеВидеоPDFТекст
6 параметров
GLM 4.6V FlashX
zhipu/glm-4.6v-flashx

Zhipu AI GLM 4.6V FlashX — 9B lightweight vision model with function-calling. Supports image, video, and document inputs. Conservative 16K max output.

zhipu
Контекст
131K
Макс. вывод
16K
Цена
Вход$0.060за 1 млн токенов
Выход$0.360за 1 млн токенов
Вход → Выход
ТекстИзображениеВидеоPDFТекст
6 параметров
GLM 4.7
zhipu/glm-4.7

Zhipu AI GLM 4.7 (358B MoE). Interleaved thinking before every response and tool call. Preserved thinking across multi-turn conversations.

zhipu
Контекст
203K
Макс. вывод
131K
Цена
Вход$0.960за 1 млн токенов
Выход$3.48за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
GLM 4.7 Flash
zhipu/glm-4.7-flash

Zhipu AI GLM 4.7 Flash — free-tier lightweight model (30B total, 3B active MoE). Strong reasoning despite small active params. Rate-limited concurrency.

zhipu
Контекст
203K
Макс. вывод
131K
Цена
--
Вход → Выход
ТекстТекст
7 параметров
GLM 4.7 FlashX
zhipu/glm-4.7-flashx

Zhipu AI GLM 4.7 FlashX — high-concurrency paid variant of GLM-4.7 Flash with enhanced throughput.

zhipu
Контекст
203K
Макс. вывод
131K
Цена
Вход$0.144за 1 млн токенов
Выход$0.720за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
GLM 5
zhipu/glm-5

Zhipu AI's flagship model (754B total, 40B active MoE). DeepSeek Sparse Attention architecture. Strong math/science reasoning.

zhipu
Контекст
203K
Макс. вывод
131K
Цена
Вход$1.56за 1 млн токенов
Выход$5.04за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
GLM 5 Turbo
zhipu/glm-5-turbo

Zhipu AI GLM 5 Turbo — optimized for sequential task execution with improved continuity. Lower latency than GLM-5 flagship.

zhipu
Контекст
203K
Макс. вывод
131K
Цена
Вход$1.80за 1 млн токенов
Выход$6.00за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
GLM 5.1
zhipu/glm-5.1

Zhipu AI GLM 5.1 — latest flagship model with enhanced reasoning and coding capabilities.

zhipu
Контекст
203K
Макс. вывод
131K
Цена
Вход$0.588за 1 млн токенов
Выход$4.70за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
GLM 5V Turbo
zhipu/glm-5v-turbo

Zhipu AI GLM 5V Turbo — vision-capable model for image understanding and multimodal tasks.

zhipu
Контекст
203K
Макс. вывод
131K
Цена
Вход$0.588за 1 млн токенов
Выход$4.70за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
6 параметров
GLM Image
zhipu/glm-image

Zhipu AI GLM Image — flagship text-to-image generation model. 2K resolution, strong Chinese typography support.

zhipu
Контекст
--
Макс. вывод
--
Цена
Запрос$0.0167за запрос
Изображение$0.0209за изображение
Вход → Выход
ТекстИзображение
5 параметровещё 1 цен
GLM OCR
zhipu/glm-ocr

Zhipu AI GLM OCR (0.9B) — document parser for PDF/image to structured Markdown text extraction.

zhipu
Контекст
66K
Макс. вывод
16K
Цена
Вход$0.048за 1 млн токенов
Выход$0.048за 1 млн токенов
Вход → Выход
ТекстИзображениеPDFТекст
5 параметров
GLM Search Pro
zhipu/search-pro

Zhipu AI Web Search (Pro) — premium multi-engine ZhipuAI self-developed search with lower empty-result rate and higher recall + accuracy than search-std. Returns structured web results with citations; streaming returns a single chunk.

zhipu
Контекст
8K
Макс. вывод
--
Цена
Запрос$0.0108за запрос
Вход → Выход
ТекстТекст
3 параметров
GLM Search Pro (Quark)
zhipu/search-pro-quark

Zhipu AI Web Search routed through Quark — vertical-content focused with precise retrieval against Quark's index. Returns structured web results with citations; streaming returns a single chunk.

zhipu
Контекст
8K
Макс. вывод
--
Цена
Запрос$0.0168за запрос
Вход → Выход
ТекстТекст
3 параметров
GLM Search Pro (Sogou)
zhipu/search-pro-sogou

Zhipu AI Web Search routed through Sogou — strong vertical coverage of the Tencent ecosystem (news, Penguin Hao, Zhihu) and authoritative for encyclopedia / medical queries. Returns structured web results with citations; streaming returns a single chunk.

zhipu
Контекст
8K
Макс. вывод
--
Цена
Запрос$0.0168за запрос
Вход → Выход
ТекстТекст
3 параметров
GLM Search Std
zhipu/search-std

Zhipu AI Web Search (Standard) — basic ZhipuAI self-developed search engine, optimised for cost-effective daily-query workloads. Returns structured web results with citations; streaming returns a single chunk.

zhipu
Контекст
8K
Макс. вывод
--
Цена
Запрос$0.0036за запрос
Вход → Выход
ТекстТекст
3 параметров
GPT Image 1
openai/gpt-image-1

Previous generation image generation model.

openai
Контекст
--
Макс. вывод
--
Цена
Изображение$0.0504за изображение
Вход$6.00за 1 млн токенов
Вход → Выход
ТекстИзображениеИзображение
7 параметровещё 5 цен
GPT Image 1 Mini
openai/gpt-image-1-mini

Cost-efficient version of GPT Image 1.

openai
Контекст
--
Макс. вывод
--
Цена
Изображение$0.0204за изображение
Вход$2.40за 1 млн токенов
Вход → Выход
ТекстИзображениеИзображение
7 параметровещё 5 цен
GPT Image 1.5
openai/gpt-image-1.5

State-of-the-art image generation model.

openai
Контекст
--
Макс. вывод
--
Цена
Изображение$0.0408за изображение
Вход$6.00за 1 млн токенов
Вход → Выход
ТекстИзображениеИзображение
7 параметровещё 5 цен
GPT Image 2
openai/gpt-image-2

OpenAI's most advanced image generation model with native reasoning — thinks before drawing. 2K resolution, multi-image consistency, magazine-quality typography, and image editing. Released April 21, 2026.

openai
Контекст
--
Макс. вывод
--
Цена
Изображение$0.0636за изображение
Вход$6.00за 1 млн токенов
Вход → Выход
ТекстИзображениеИзображение
7 параметровещё 6 цен
GPT OSS 120B
openai/gpt-oss-120b

OpenAI's open-source 120B model with hybrid reasoning, extended thinking, efficient code generation, agentic search, computer use, and tool use capabilities.

openai
Контекст
128K
Макс. вывод
16K
Цена
Вход$0.240за 1 млн токенов
Выход$0.960за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
GPT OSS 20B
openai/gpt-oss-20b

OpenAI's open-source 20B model with hybrid reasoning, extended thinking, efficient code generation, agentic search, and tool use. Cost-effective alternative to the 120B variant.

openai
Контекст
128K
Макс. вывод
16K
Цена
Вход$0.120за 1 млн токенов
Выход$0.480за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
GPT OSS Safeguard 120B
openai/gpt-oss-safeguard-120b

OpenAI's advanced safety reasoning model (120B). Nuanced policy interpretation, multi-turn safety analysis, and justified decisions for content moderation.

openai
Контекст
128K
Макс. вывод
16K
Цена
Вход$0.240за 1 млн токенов
Выход$0.960за 1 млн токенов
Вход → Выход
ТекстТекст
5 параметров
GPT OSS Safeguard 20B
openai/gpt-oss-safeguard-20b

OpenAI's safety classification model (20B). Policy reasoning, content filtering, risk analysis, and justification generation.

openai
Контекст
128K
Макс. вывод
16K
Цена
Вход$0.120за 1 млн токенов
Выход$0.240за 1 млн токенов
Вход → Выход
ТекстТекст
5 параметров
GPT-4.1
openai/gpt-4.1

OpenAI's smartest non-reasoning model. Excels at instruction following and tool calling with broad knowledge across domains. Features a 1M token context window and low latency.

openai
Контекст
1.0M
Макс. вывод
33K
Цена
Вход$2.40за 1 млн токенов
Выход$9.60за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
GPT-4.1 Mini
openai/gpt-4.1-mini

Smaller, faster version of GPT-4.1. Excels at instruction following and tool calling with a 1M token context window and low latency without a reasoning step.

openai
Контекст
1.0M
Макс. вывод
33K
Цена
Вход$0.480за 1 млн токенов
Выход$1.92за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
GPT-4.1 Nano
openai/gpt-4.1-nano

Fastest, most cost-efficient version of GPT-4.1. Excels at instruction following and tool calling with a 1M token context window and minimal latency.

openai
Контекст
1.0M
Макс. вывод
33K
Цена
Вход$0.120за 1 млн токенов
Выход$0.480за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
GPT-4o
openai/gpt-4o

OpenAI's versatile, high-intelligence flagship model. Accepts text and image inputs, produces text outputs including structured outputs. Best model for most tasks outside reasoning-heavy use cases.

openai
Контекст
128K
Макс. вывод
16K
Цена
Вход$3.00за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
GPT-4o Audio
openai/gpt-4o-audio-preview

GPT-4o model capable of audio inputs and outputs.

openai
Контекст
--
Макс. вывод
--
Цена
Вход$3.00за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстАудиоТекстАудио
5 параметровещё 2 цен
GPT-4o Mini
openai/gpt-4o-mini

Fast, affordable small model for focused tasks. Accepts text and image inputs, produces text outputs. Ideal for fine-tuning and cost-efficient workloads.

openai
Контекст
128K
Макс. вывод
16K
Цена
Вход$0.180за 1 млн токенов
Выход$0.720за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
GPT-4o Mini Audio
openai/gpt-4o-mini-audio-preview

Smaller audio-capable GPT-4o model.

openai
Контекст
--
Макс. вывод
--
Цена
Вход$0.180за 1 млн токенов
Выход$0.720за 1 млн токенов
Вход → Выход
ТекстАудиоТекстАудио
5 параметровещё 2 цен
GPT-4o Mini Realtime
openai/gpt-4o-mini-realtime-preview

Smaller realtime model for text and audio workflows.

openai
Контекст
--
Макс. вывод
--
Цена
Вход$0.720за 1 млн токенов
Выход$2.88за 1 млн токенов
Вход → Выход
ТекстАудиоТекстАудио
6 параметровещё 2 цен
GPT-4o Mini Transcribe
openai/gpt-4o-mini-transcribe

Speech-to-text model powered by GPT-4o mini.

openai
Контекст
--
Макс. вывод
--
Цена
Запрос$0.0036за запрос
Вход$1.50за 1 млн токенов
Вход → Выход
АудиоТекст
5 параметровещё 3 цен
GPT-4o Mini TTS
openai/gpt-4o-mini-tts

Text-to-speech model powered by GPT-4o mini.

openai
Контекст
--
Макс. вывод
--
Цена
Запрос$0.018за запрос
Вход$0.720за 1 млн токенов
Вход → Выход
ТекстАудио
4 параметровещё 3 цен
GPT-4o Realtime
openai/gpt-4o-realtime-preview

Realtime text and audio model from the GPT-4o family.

openai
Контекст
--
Макс. вывод
--
Цена
Вход$6.00за 1 млн токенов
Выход$24.00за 1 млн токенов
Вход → Выход
ТекстАудиоТекстАудио
6 параметровещё 2 цен
GPT-4o Transcribe
openai/gpt-4o-transcribe

Speech-to-text model powered by GPT-4o.

openai
Контекст
--
Макс. вывод
--
Цена
Запрос$0.0072за запрос
Вход$3.00за 1 млн токенов
Вход → Выход
АудиоТекст
5 параметровещё 3 цен
GPT-4o Transcribe Diarize
openai/gpt-4o-transcribe-diarize

Transcription model that identifies who is speaking when.

openai
Контекст
--
Макс. вывод
--
Цена
Запрос$0.0079за запрос
Вход$3.00за 1 млн токенов
Вход → Выход
АудиоТекст
5 параметровещё 3 цен
GPT-5
openai/gpt-5

OpenAI's intelligent reasoning model for coding and agentic tasks with configurable reasoning effort. Features a 400K context window and 128K max output.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$1.50за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5 Mini
openai/gpt-5-mini

A faster, cost-efficient version of GPT-5 for well-defined tasks. Features reasoning token support with a 400K context window and 128K max output at a fraction of the cost.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$0.300за 1 млн токенов
Выход$2.40за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5 Nano
openai/gpt-5-nano

Fastest, most cost-efficient version of GPT-5. Great for summarization and classification tasks with reasoning token support. Features a 400K context window and 128K max output.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$0.060за 1 млн токенов
Выход$0.480за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5 Pro
openai/gpt-5-pro

Version of GPT-5 that produces smarter and more precise responses with deeper reasoning.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$22.50за 1 млн токенов
Выход$180.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5-Codex
openai/gpt-5-codex

Version of GPT-5 optimized for agentic coding in Codex.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$1.50за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5.1
openai/gpt-5.1

OpenAI's previous flagship reasoning model for coding and agentic tasks with configurable reasoning effort. Features a 400K context window and 128K max output.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$1.50за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5.1 Codex
openai/gpt-5.1-codex

Version of GPT-5.1 optimized for agentic coding in Codex.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$1.50за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5.1 Codex Mini
openai/gpt-5.1-codex-mini

Smaller, more cost-effective version of GPT-5.1-Codex.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$0.300за 1 млн токенов
Выход$2.40за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5.1-Codex-Max
openai/gpt-5.1-codex-max

Version of GPT-5.1 Codex optimized for long-running tasks.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$1.50за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5.2
openai/gpt-5.2

OpenAI's best model for coding and agentic tasks across industries. Features a 400K context window with 128K max output, reasoning token support, and state-of-the-art long-context reasoning.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$2.10за 1 млн токенов
Выход$16.80за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5.2-Codex
openai/gpt-5.2-codex

Intelligent coding model optimized for long-horizon, agentic coding tasks.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$1.50за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5.3-Codex
openai/gpt-5.3-codex

Most capable agentic coding model to date.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$6.00за 1 млн токенов
Выход$48.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5.4
openai/gpt-5.4

Best intelligence at scale for agentic, coding, and professional workflows.

openai
Контекст
1M
Макс. вывод
128K
Цена
Вход$3.00за 1 млн токенов
Выход$18.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5.4 Mini
openai/gpt-5.4-mini

Strongest mini model for coding, computer use, and subagents. Fast and cost-efficient with reasoning token support, 400K context window and 128K max output.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$1.80за 1 млн токенов
Выход$5.40за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5.4 Nano
openai/gpt-5.4-nano

Smallest and fastest GPT-5.4 variant for lightweight agentic tasks. 400K context window and 128K max output with reasoning support.

openai
Контекст
400K
Макс. вывод
128K
Цена
Вход$0.360за 1 млн токенов
Выход$2.10за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5.4 Pro
openai/gpt-5.4-pro

Version of GPT-5.4 that produces smarter and more precise responses.

openai
Контекст
1M
Макс. вывод
128K
Цена
Вход$48.00за 1 млн токенов
Выход$288.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
GPT-5.5
openai/gpt-5.5

Next-generation frontier model with 1M context, advanced reasoning, and multimodal input for agentic, coding, and professional workflows.

openai
Контекст
1M
Макс. вывод
128K
Цена
Вход$8.40за 1 млн токенов
Выход$48.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
13 параметров
GPT-5.5 Pro
openai/gpt-5.5-pro

Version of GPT-5.5 that produces smarter and more precise responses with enhanced reasoning depth.

openai
Контекст
1M
Макс. вывод
128K
Цена
Вход$48.00за 1 млн токенов
Выход$288.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
13 параметров
gpt-audio
openai/gpt-audio

Audio inputs and outputs with the Chat Completions API.

openai
Контекст
--
Макс. вывод
--
Цена
Вход$3.00за 1 млн токенов
Выход$12.00за 1 млн токенов
Вход → Выход
ТекстАудиоТекстАудио
7 параметровещё 2 цен
gpt-audio-1.5
openai/gpt-audio-1.5

Best voice model for audio in, audio out with Chat Completions.

openai
Контекст
--
Макс. вывод
--
Цена
Вход$4.80за 1 млн токенов
Выход$19.20за 1 млн токенов
Вход → Выход
ТекстАудиоИзображениеТекстАудио
7 параметровещё 5 цен
gpt-audio-mini
openai/gpt-audio-mini

Cost-efficient version of GPT Audio.

openai
Контекст
--
Макс. вывод
--
Цена
Вход$0.180за 1 млн токенов
Выход$0.720за 1 млн токенов
Вход → Выход
ТекстАудиоТекстАудио
7 параметровещё 2 цен
gpt-realtime
openai/gpt-realtime

Model capable of realtime text and audio inputs and outputs.

openai
Контекст
--
Макс. вывод
--
Цена
Вход$4.80за 1 млн токенов
Выход$19.20за 1 млн токенов
Вход → Выход
ТекстАудиоТекстАудио
6 параметровещё 2 цен
gpt-realtime-1.5
openai/gpt-realtime-1.5

Best voice model for audio in, audio out.

openai
Контекст
--
Макс. вывод
--
Цена
Вход$4.80за 1 млн токенов
Выход$19.20за 1 млн токенов
Вход → Выход
ТекстАудиоИзображениеТекстАудио
6 параметровещё 5 цен
gpt-realtime-2
openai/gpt-realtime-2

Successor to gpt-realtime-1.5 with improved voice synthesis and lower latency. Realtime audio in, audio out.

openai
Контекст
--
Макс. вывод
--
Цена
Вход$6.00за 1 млн токенов
Выход$24.00за 1 млн токенов
Вход → Выход
ТекстАудиоИзображениеТекстАудио
6 параметров
gpt-realtime-mini
openai/gpt-realtime-mini

Cost-efficient version of GPT Realtime.

openai
Контекст
--
Макс. вывод
--
Цена
Вход$0.720за 1 млн токенов
Выход$2.88за 1 млн токенов
Вход → Выход
ТекстАудиоТекстАудио
6 параметровещё 2 цен
gpt-realtime-translate
openai/gpt-realtime-translate

Realtime speech-to-text translation. Accepts audio in any supported source language, returns translated transcript in target language (typically English).

openai
Контекст
--
Макс. вывод
--
Цена
Вход$6.00за 1 млн токенов
Выход$24.00за 1 млн токенов
Вход → Выход
АудиоТекст
4 параметров
gpt-realtime-whisper
openai/gpt-realtime-whisper

Whisper-class automatic speech recognition over the realtime channel. Audio in, transcribed text out.

openai
Контекст
--
Макс. вывод
--
Цена
Запрос$0.009за запрос
Вход → Выход
АудиоТекст
4 параметров
Grok 3
xai/grok-3

xAI's previous flagship model with 131K context window. Strong general-purpose performance with function calling and structured output support.

xai
Контекст
131K
Макс. вывод
33K
Цена
Вход$5.40за 1 млн токенов
Выход$27.00за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Grok 3 Mini
xai/grok-3-mini

Cost-efficient reasoning model from xAI with 131K context window. Ideal for tasks requiring reasoning at lower cost with function calling and structured output support.

xai
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.540за 1 млн токенов
Выход$0.900за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
Grok 4
xai/grok-4

xAI's most powerful reasoning model with 256K token context window. Excels at complex reasoning, coding, and multi-step problem solving with function calling and structured outputs.

xai
Контекст
256K
Макс. вывод
66K
Цена
Вход$5.40за 1 млн токенов
Выход$27.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
Grok 4 Fast
xai/grok-4-fast-non-reasoning

xAI's fast model with 2M token context window. Optimized for speed without reasoning overhead, supporting text and image inputs with function calling and structured outputs.

xai
Контекст
2M
Макс. вывод
128K
Цена
Вход$0.360за 1 млн токенов
Выход$0.900за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Grok 4 Fast Reasoning
xai/grok-4-fast-reasoning

xAI's fast reasoning model with 2M token context window. Combines speed with strong reasoning capabilities, supporting text and image inputs with function calling and structured outputs.

xai
Контекст
2M
Макс. вывод
128K
Цена
Вход$0.360за 1 млн токенов
Выход$0.900за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
Grok 4.1 Fast
xai/grok-4-1-fast-non-reasoning

xAI's fastest model with 2M token context window. Optimized for speed without reasoning overhead, supporting text and image inputs with function calling and structured outputs.

xai
Контекст
2M
Макс. вывод
66K
Цена
Вход$0.360за 1 млн токенов
Выход$0.900за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Grok 4.1 Fast Reasoning
xai/grok-4-1-fast-reasoning

xAI's latest fast reasoning model with 2M token context window. Combines speed with strong reasoning capabilities, supporting text and image inputs with function calling and structured outputs.

xai
Контекст
2M
Макс. вывод
66K
Цена
Вход$0.360за 1 млн токенов
Выход$0.900за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
Grok 4.20
xai/grok-4.20-non-reasoning

xAI's flagship model (March 2026) with 2M token context window. Fast general-purpose mode without reasoning overhead, supporting text and image inputs with function calling and structured outputs.

xai
Контекст
2M
Макс. вывод
66K
Цена
Вход$3.60за 1 млн токенов
Выход$10.80за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Grok 4.20 Multi-Agent
xai/grok-4.20-multi-agent

xAI's flagship model optimized for multi-agent orchestration with 2M token context window. Designed for agent-to-agent coordination, delegation, and parallel task execution.

xai
Контекст
2M
Макс. вывод
66K
Цена
Вход$3.60за 1 млн токенов
Выход$10.80за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
Grok 4.20 Reasoning
xai/grok-4.20-reasoning

xAI's flagship model (March 2026) with 2M token context window and deep reasoning. Best for complex multi-step tasks, analysis, and research with function calling and structured outputs.

xai
Контекст
2M
Макс. вывод
66K
Цена
Вход$3.60за 1 млн токенов
Выход$10.80за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
Grok 4.3
xai/grok-4.3

xAI's most advanced flagship model — industry-leading non-hallucination rate, agentic tool calling, and instruction following. 1M token context, text + image input, configurable reasoning (none/low/medium/high), function calling, structured outputs.

xai
Контекст
1M
Макс. вывод
66K
Цена
Вход$1.87за 1 млн токенов
Выход$3.76за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
Grok Code Fast 1
xai/grok-code-fast-1

xAI's specialized coding model with reasoning capabilities. Optimized for code generation, analysis, and debugging tasks with function calling and structured outputs.

xai
Контекст
256K
Макс. вывод
66K
Цена
Вход$0.360за 1 млн токенов
Выход$2.70за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
Hunyuan A13B
tencent/hunyuan-a13b

Tencent Hunyuan A13B — efficient MoE model for general-purpose chat and tool use.

tencent
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.240за 1 млн токенов
Выход$0.960за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
IndexTTS-2
indexteam/indextts-2

IndexTeam's neural TTS model with low latency and high quality.

indexteam
Контекст
--
Макс. вывод
--
Цена
Запрос$8.58за запрос
Вход → Выход
ТекстАудио
4 параметров
Kimi K2
moonshot/kimi-k2

Moonshot AI Kimi K2 Instruct — fast non-thinking variant for efficient chat and tool use.

moonshot
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.972за 1 млн токенов
Выход$3.84за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
Kimi K2 Thinking
moonshot/kimi-k2-thinking

Moonshot AI's deep reasoning model (1T total, 32B active MoE). Specialist for 200-300 step stable tool orchestration, long-horizon planning, and complex coding. Text-only.

moonshot
Контекст
256K
Макс. вывод
64K
Цена
Вход$0.960за 1 млн токенов
Выход$3.90за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
Kimi K2.5
moonshot/kimi-k2.5

Moonshot AI's flagship multimodal model (1T total, 32B active MoE, 384 experts). Native vision with MoonViT encoder. Thinking and instant modes with tool-augmented reasoning.

moonshot
Контекст
256K
Макс. вывод
64K
Цена
Вход$0.960за 1 млн токенов
Выход$4.68за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Kimi K2.6
moonshot/kimi-k2.6

Moonshot AI's 2026-04 flagship — 1T-parameter MoE that ties GPT-5.5 on coding benchmarks. Agent swarm scales to 300 sub-agents and 4000 coordinated steps. Open-weight.

moonshot
Контекст
256K
Макс. вывод
64K
Цена
Вход$1.14за 1 млн токенов
Выход$5.40за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Ling Flash 2.0
inclusionai/ling-flash-2

InclusionAI Ling Flash 2.0 — fast inference model for general-purpose tasks.

inclusionai
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.084за 1 млн токенов
Выход$0.252за 1 млн токенов
Вход → Выход
ТекстТекст
4 параметров
Llama 3.1 405B
meta/llama-3.1-405b

Meta's largest open model at 405B parameters. Frontier-class performance across coding, math, reasoning, and multilingual tasks with 128K context.

meta
Контекст
128K
Макс. вывод
8K
Цена
Вход$3.72за 1 млн токенов
Выход$3.72за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
Llama 3.1 70B
meta/llama-3.1-70b

Llama 3.1 70B with expanded 128K context, multilinguality, and improved reasoning. Optimized for multilingual dialogue and assistant-like chat.

meta
Контекст
128K
Макс. вывод
8K
Цена
Вход$1.08за 1 млн токенов
Выход$1.08за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
Llama 3.1 8B
meta/llama-3.1-8b

Llama 3.1 8B with 128K context length, multilinguality, and improved reasoning. Optimized for multilingual dialogue, efficient inference on consumer hardware.

meta
Контекст
128K
Макс. вывод
8K
Цена
Вход$0.336за 1 млн токенов
Выход$0.336за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
Llama 3.2 11B Vision
meta/llama-3.2-11b

Llama 3.2 11B with vision capabilities. Efficient multimodal model for image understanding at low cost.

meta
Контекст
128K
Макс. вывод
8K
Цена
Вход$0.240за 1 млн токенов
Выход$0.240за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
4 параметров
Llama 3.2 1B
meta/llama-3.2-1b

Llama 3.2 1B lightweight model with on-device processing for improved security and privacy. Ideal for multilingual dialogue, personal information management, knowledge retrieval, and rewriting tasks on edge devices.

meta
Контекст
128K
Макс. вывод
8K
Цена
Вход$0.156за 1 млн токенов
Выход$0.156за 1 млн токенов
Вход → Выход
ТекстТекст
4 параметров
Llama 3.2 3B
meta/llama-3.2-3b

Llama 3.2 3B lightweight model. Delivers highly accurate results with capabilities including text generation, summarization, sentiment analysis, and contextual understanding. Ideal for edge devices and mobile AI.

meta
Контекст
128K
Макс. вывод
8K
Цена
Вход$0.240за 1 млн токенов
Выход$0.240за 1 млн токенов
Вход → Выход
ТекстТекст
4 параметров
Llama 3.2 90B Vision
meta/llama-3.2-90b

Llama 3.2 90B with vision capabilities. Strong multimodal performance for image understanding and text generation tasks.

meta
Контекст
128K
Макс. вывод
8K
Цена
Вход$1.08за 1 млн токенов
Выход$1.08за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
4 параметров
Llama 3.3 70B
meta/llama-3.3-70b

Llama 3.3 70B instruct model delivers on-par performance with the 405B model at lower cost. Optimized for multilingual dialogue with strong reasoning capabilities.

meta
Контекст
128K
Макс. вывод
8K
Цена
Вход$1.08за 1 млн токенов
Выход$1.08за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
Llama 3.3 70B Versatile
meta/llama-3.3-70b-versatile

Meta's Llama 3.3 70B tuned for versatile general-purpose tasks via Groq LPU inference.

meta
Контекст
128K
Макс. вывод
33K
Цена
Вход$0.948за 1 млн токенов
Выход$1.20за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Llama 4 Maverick
meta/llama-4-maverick

Llama 4 Maverick (400B total, 17B active, 128 experts MoE) offers industry-leading performance in image and text understanding with support for 12 languages. Great for precise image understanding and creative writing. Our product workhorse model for general assistant and chat use cases.

meta
Контекст
1M
Макс. вывод
16K
Цена
Вход$0.360за 1 млн токенов
Выход$1.50за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Llama 4 Scout
meta/llama-4-scout

Llama 4 Scout is a general purpose model with 17B active parameters, 16 experts, and 109B total parameters. Features an industry-leading 10M token context length, enabling multi-document summarization, parsing extensive user activity, and reasoning over vast codebases.

meta
Контекст
10M
Макс. вывод
16K
Цена
Вход$0.264за 1 млн токенов
Выход$1.02за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Magistral Small
mistral/magistral-small

Mistral's reasoning-enhanced small model (24B parameters) with vision capabilities. Uses [THINK]/[/THINK] tags for reasoning. Balances reasoning depth with cost efficiency.

mistral
Контекст
128K
Макс. вывод
131K
Цена
Вход$0.600за 1 млн токенов
Выход$1.80за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
MiniMax M2
minimax/m2

MiniMax M2 is a MoE model blending frontier-level intelligence with efficient active parameters. Engineered for AI agents with strong reasoning, coding, and multilingual performance. Ideal for general-purpose chat/coding, tool use, and high-throughput inference.

minimax
Контекст
205K
Макс. вывод
66K
Цена
Вход$0.480за 1 млн токенов
Выход$1.92за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
MiniMax M2.1
minimax/m2.1

MiniMax M2.1 is an open-weight model focused on coding, tool use, and long-horizon task planning. Trained with emphasis on practical benchmarks covering front-end, backend, and workflow automation. General-purpose backbone for agent-based applications with reliable instruction following.

minimax
Контекст
205K
Макс. вывод
66K
Цена
Вход$0.480за 1 млн токенов
Выход$1.92за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
MiniMax M2.1 Highspeed
minimax/m2.1-highspeed

MiniMax M2.1 Highspeed variant with ~100 tokens/sec output speed. Same capabilities as M2.1 at 2x cost for latency-sensitive applications.

minimax
Контекст
205K
Макс. вывод
66K
Цена
Вход$0.960за 1 млн токенов
Выход$3.84за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
MiniMax M2.5
minimax/m2.5

MiniMax M2.5 is an agent-native frontier model trained to reason efficiently, decompose tasks optimally, and complete complex workflows under real-world constraints. Combines high inference throughput with RL-focused token-efficient reasoning. Suited for full-stack software projects, research workflows, long-horizon planning, and multi-tool orchestration.

minimax
Контекст
205K
Макс. вывод
66K
Цена
Вход$0.480за 1 млн токенов
Выход$1.92за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
MiniMax M2.5 Highspeed
minimax/m2.5-highspeed

MiniMax M2.5 Highspeed variant with ~100 tokens/sec output speed. Same capabilities as M2.5 at 2x cost for latency-sensitive applications.

minimax
Контекст
205K
Макс. вывод
66K
Цена
Вход$0.960за 1 млн токенов
Выход$3.84за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
MiniMax M2.7
minimax/m2.7

MiniMax M2.7 is a frontier reasoning model with interleaved thinking chains and multi-tool orchestration. 204K context with strong performance on agentic workflows, coding, and complex multi-step reasoning tasks.

minimax
Контекст
205K
Макс. вывод
66K
Цена
Вход$0.480за 1 млн токенов
Выход$1.92за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
MiniMax M2.7 Highspeed
minimax/m2.7-highspeed

MiniMax M2.7 Highspeed variant with ~100 tokens/sec output speed. Same capabilities as M2.7 at 2x cost for latency-sensitive applications.

minimax
Контекст
205K
Макс. вывод
66K
Цена
Вход$0.960за 1 млн токенов
Выход$3.84за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Ministral 14B
mistral/ministral-14b

Mistral's efficient 14B parameter model with vision support. Good balance of capability and speed for everyday tasks.

mistral
Контекст
128K
Макс. вывод
16K
Цена
Вход$0.312за 1 млн токенов
Выход$0.312за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Ministral 3B
mistral/ministral-3b

Mistral's smallest model at 3B parameters. Ultra-fast and cost-efficient for lightweight tasks.

mistral
Контекст
128K
Макс. вывод
16K
Цена
Вход$0.120за 1 млн токенов
Выход$0.120за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Ministral 8B
mistral/ministral-8b

Mistral's small 8B parameter model with vision. Cost-effective for simpler tasks and high-throughput workloads.

mistral
Контекст
128K
Макс. вывод
16K
Цена
Вход$0.180за 1 млн токенов
Выход$0.180за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Mistral Large
mistral/mistral-large

Mistral's flagship large model. Top-tier reasoning, coding, and multilingual with vision.

mistral
Контекст
128K
Макс. вывод
16K
Цена
Вход$2.40за 1 млн токенов
Выход$7.20за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Mistral Large 3
mistral/mistral-large-3

Mistral's flagship 675B parameter model. Top-tier reasoning, coding, and multilingual capabilities with vision support.

mistral
Контекст
128K
Макс. вывод
16K
Цена
Вход$0.600за 1 млн токенов
Выход$1.80за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Mistral Small
mistral/mistral-small

Mistral's efficient small model. Low-cost option for simple tasks and high throughput.

mistral
Контекст
128K
Макс. вывод
16K
Цена
Вход$0.120за 1 млн токенов
Выход$0.360за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Mistral Small 4
mistral/mistral-small-4

Mistral's 2026-03 unified small model (119B MoE, 6B active). Combines Magistral (reasoning), Pixtral (multimodal), and Devstral (agentic coding) capabilities into a single model.

mistral
Контекст
131K
Макс. вывод
16K
Цена
Вход$0.240за 1 млн токенов
Выход$0.720за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
8 параметров
Mixtral 8x7B Instruct
mistral/mixtral-8x7b-instruct

Mistral's Mixtral 8x7B mixture-of-experts model. Cost-effective for general tasks.

mistral
Контекст
33K
Макс. вывод
4K
Цена
Вход$0.420за 1 млн токенов
Выход$0.420за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
Nemotron Nano 30B
nvidia/nemotron-nano-30b

NVIDIA's efficient hybrid model (30B total, 3.5B active MoE). Mamba-2 + Attention layers with 1M context for edge deployment.

nvidia
Контекст
1M
Макс. вывод
262K
Цена
Вход$0.072за 1 млн токенов
Выход$0.288за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Nemotron Super 120B
nvidia/nemotron-super-120b

NVIDIA's hybrid LatentMoE model (120B total, 12B active). Mamba-2 + Attention + MoE architecture with 1M context. Multi-Token Prediction for fast inference.

nvidia
Контекст
1M
Макс. вывод
262K
Цена
Вход$0.240за 1 млн токенов
Выход$1.02за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
o3
openai/o3

OpenAI's powerful reasoning model that pushes the frontier across coding, math, science, and visual perception. Excels in complex queries requiring multi-faceted analysis. Succeeded by GPT-5.

openai
Контекст
200K
Макс. вывод
100K
Цена
Вход$2.40за 1 млн токенов
Выход$9.60за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
6 параметров
o3-deep-research
openai/o3-deep-research

Most powerful deep research model.

openai
Контекст
200K
Макс. вывод
100K
Цена
Вход$12.00за 1 млн токенов
Выход$48.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
6 параметров
o3-pro
openai/o3-pro

Version of o3 with more compute for better, more precise responses. Best for complex reasoning tasks where accuracy is paramount.

openai
Контекст
200K
Макс. вывод
100K
Цена
Вход$24.00за 1 млн токенов
Выход$96.00за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
6 параметров
o4-mini
openai/o4-mini

Fast, cost-efficient reasoning model with a 200K context window. Ideal for tasks requiring reasoning at lower cost. Succeeded by GPT-5 Mini.

openai
Контекст
200K
Макс. вывод
100K
Цена
Вход$1.32за 1 млн токенов
Выход$5.28за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
6 параметров
o4-mini-deep-research
openai/o4-mini-deep-research

Faster, more affordable deep research model.

openai
Контекст
200K
Макс. вывод
100K
Цена
Вход$2.40за 1 млн токенов
Выход$9.60за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
6 параметров
Pixtral Large
mistral/pixtral-large

Mistral's multimodal large model with strong vision capabilities.

mistral
Контекст
128K
Макс. вывод
16K
Цена
Вход$2.40за 1 млн токенов
Выход$7.20за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Qwen Flash
qwen/qwen-flash

Alibaba Qwen's ultra-low-cost flash tier. 1M context with steep input/output discount.

qwen
Контекст
1.0M
Макс. вывод
33K
Цена
Вход$0.084за 1 млн токенов
Выход$0.600за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Qwen Image Edit
qwen/qwen-image-edit

Alibaba Qwen team's image-edit model built on the 20B Qwen-Image. Excels at text rendering inside images and semantic + appearance edits. Routed via SiliconFlow.

qwen
Контекст
--
Макс. вывод
--
Цена
Изображение$0.048за изображение
Вход$0.048за 1 млн токенов
Вход → Выход
ТекстИзображениеИзображение
6 параметровещё 1 цен
Qwen Long
qwen/qwen-long

Alibaba Qwen's long-context-dedicated model. 10M token context window for document-scale analysis. CN deployment only.

qwen
Контекст
10.5M
Макс. вывод
8K
Цена
Вход$0.144за 1 млн токенов
Выход$0.540за 1 млн токенов
Вход → Выход
ТекстТекст
5 параметров
Qwen Max
qwen/qwen-max

Alibaba Qwen's previous flagship commercial model. 128K context. Strong reasoning and tool use.

qwen
Контекст
131K
Макс. вывод
33K
Цена
Вход$2.40за 1 млн токенов
Выход$9.60за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Qwen Plus
qwen/qwen-plus

Alibaba Qwen's mid-tier commercial model with thinking and non-thinking modes. 1M context.

qwen
Контекст
1.0M
Макс. вывод
33K
Цена
Вход$0.600за 1 млн токенов
Выход$1.80за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
Qwen Text Embedding v3
qwen/text-embedding-v3

Alibaba Qwen's general-purpose multilingual text embedding model (v3). Vendor-direct via Aliyun Bailian.

qwen
Контекст
8K
Макс. вывод
--
Цена
Вход$0.144за 1 млн токенов
Вход → Выход
Текстembedding
3 параметров
Qwen Text Embedding v4
qwen/text-embedding-v4

Alibaba Qwen's latest general-purpose multilingual text embedding model. Vendor-direct via Aliyun Bailian.

qwen
Контекст
8K
Макс. вывод
--
Цена
Вход$0.144за 1 млн токенов
Вход → Выход
Текстembedding
3 параметров
Qwen Turbo
qwen/qwen-turbo

Alibaba Qwen's high-throughput tier — fastest commercial Qwen, lowest latency. 1M context.

qwen
Контекст
1.0M
Макс. вывод
33K
Цена
Вход$0.084за 1 млн токенов
Выход$0.300за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Qwen3 14B
qwen/qwen3-14b

Qwen3 14B — balanced mid-range model with strong reasoning at low cost.

qwen
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.084за 1 млн токенов
Выход$0.252за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Qwen3 235B
qwen/qwen3-235b

Alibaba's flagship Qwen3 model (235B total, 22B active, 128 experts, 8 active per token MoE). Dual thinking/non-thinking mode, strong reasoning, tools, and 100+ language support.

qwen
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.360за 1 млн токенов
Выход$1.38за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
Qwen3 235B Thinking
qwen/qwen3-235b-thinking

Qwen3 235B Thinking — large reasoning model optimized for complex multi-step problem solving.

qwen
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.492за 1 млн токенов
Выход$1.68за 1 млн токенов
Вход → Выход
ТекстТекст
4 параметров
Qwen3 30B
qwen/qwen3-30b

Qwen3 30B (MoE, 3B active) — efficient large-scale reasoning at compact cost.

qwen
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.168за 1 млн токенов
Выход$0.504за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
Qwen3 30B Thinking
qwen/qwen3-30b-thinking

Qwen3 30B Thinking — efficient reasoning model (MoE, 3B active) for cost-effective chain-of-thought.

qwen
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.168за 1 млн токенов
Выход$0.504за 1 млн токенов
Вход → Выход
ТекстТекст
4 параметров
Qwen3 32B
qwen/qwen3-32b

Qwen3 dense 32B model. Excellent reasoning and coding at moderate size with thinking mode support.

qwen
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.240за 1 млн токенов
Выход$0.960за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
Qwen3 8B
qwen/qwen3-8b

Qwen3 8B — compact and fast, ideal for lightweight tasks and high-throughput scenarios.

qwen
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.036за 1 млн токенов
Выход$0.072за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Qwen3 Coder 30B
qwen/qwen3-coder-30b

Qwen3's efficient coding model (30B MoE, 3B active). Fast code generation at low cost.

qwen
Контекст
262K
Макс. вывод
66K
Цена
Вход$0.240за 1 млн токенов
Выход$0.960за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
Qwen3 Coder 480B
qwen/qwen3-coder-480b

Qwen3's largest coding-specialized model (480B total, 35B active, 160 experts, 8 active per token MoE). State-of-the-art code generation and understanding. Non-thinking mode only.

qwen
Контекст
262K
Макс. вывод
66K
Цена
Вход$0.720за 1 млн токенов
Выход$2.82за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Qwen3 Coder Plus
qwen/qwen3-coder-plus

Alibaba Qwen's commercial coder tier. Repository-aware coding, function calling, 256K-to-1M context with tiered pricing.

qwen
Контекст
262K
Макс. вывод
33K
Цена
Вход$1.44за 1 млн токенов
Выход$7.20за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Qwen3 Max
qwen/qwen3-max

Alibaba Qwen's flagship commercial model (Qwen3 series). 256K context, top-tier reasoning and coding. Vendor-direct via Aliyun Bailian.

qwen
Контекст
262K
Макс. вывод
33K
Цена
Вход$1.80за 1 млн токенов
Выход$9.00за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Qwen3 Next 80B
qwen/qwen3-next-80b

Qwen3 Next generation hybrid Transformer-Mamba model (80B total, 3B active MoE with 512 experts). 10x inference throughput vs Qwen3-32B on long contexts.

qwen
Контекст
262K
Макс. вывод
16K
Цена
Вход$0.240за 1 млн токенов
Выход$0.960за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
Qwen3 VL 235B
qwen/qwen3-vl-235b

Qwen3 vision-language model (235B MoE, 22B active). Full multimodal: images, video, 2D/3D spatial grounding, OCR in 32 languages, GUI understanding.

qwen
Контекст
256K
Макс. вывод
33K
Цена
Вход$0.360за 1 млн токенов
Выход$1.38за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
7 параметров
Qwen3 VL 32B
qwen/qwen3-vl-32b

Qwen3 VL 32B — mid-range vision-language model with tool use for multimodal workflows.

qwen
Контекст
33K
Макс. вывод
8K
Цена
Вход$0.336за 1 млн токенов
Выход$1.01за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
6 параметров
Qwen3 VL 8B
qwen/qwen3-vl-8b

Qwen3 VL 8B — compact vision-language model for image understanding tasks.

qwen
Контекст
33K
Макс. вывод
8K
Цена
Вход$0.084за 1 млн токенов
Выход$0.252за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
4 параметров
Qwen3 VL Plus
qwen/qwen3-vl-plus

Alibaba Qwen's commercial vision-language tier. Image + text input, 256K context.

qwen
Контекст
262K
Макс. вывод
16K
Цена
Вход$0.360за 1 млн токенов
Выход$2.40за 1 млн токенов
Вход → Выход
ТекстИзображениеТекст
6 параметров
Qwen3.6 35B-A3B
qwen/qwen3.6-35b-a3b

Alibaba's Qwen 3.6 series MoE model (35B total, 3B active per token). Hybrid multimodal capabilities, 262K context, strong repo-level coding and agentic reasoning. Released April 2026.

qwen
Контекст
262K
Макс. вывод
33K
Цена
Вход$0.240за 1 млн токенов
Выход$0.960за 1 млн токенов
Вход → Выход
ТекстТекст
8 параметров
QwQ 32B
qwen/qwq-32b

QwQ 32B — Qwen reasoning model with 32B dense parameters. Strong chain-of-thought reasoning with tool calling support.

qwen
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.264за 1 млн токенов
Выход$1.02за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
QwQ Plus
qwen/qwq-plus

Alibaba Qwen's commercial reasoning-focused (thinking) model. Surface-grade reasoning, full thinking traces.

qwen
Контекст
131K
Макс. вывод
33K
Цена
Вход$1.20за 1 млн токенов
Выход$3.60за 1 млн токенов
Вход → Выход
ТекстТекст
7 параметров
Ring Flash 2.0
inclusionai/ring-flash-2

InclusionAI Ring Flash 2.0 — reasoning-focused model with chain-of-thought capabilities.

inclusionai
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.084за 1 млн токенов
Выход$0.252за 1 млн токенов
Вход → Выход
ТекстТекст
4 параметров
Seed OSS 36B
bytedance/seed-oss-36b

ByteDance Seed OSS 36B — open-source model for general-purpose chat and instruction following.

bytedance
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.168за 1 млн токенов
Выход$0.504за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
SenseVoice Small
alibaba/sensevoice-small

Alibaba's multilingual speech recognition model with speaker diarization.

alibaba
Контекст
--
Макс. вывод
--
Цена
Запрос$0.0072за запрос
Вход → Выход
АудиоТекст
5 параметров
Sonar
perplexity/sonar

Perplexity's search-augmented model. Cost-effective grounded answers with web citations.

perplexity
Контекст
128K
Макс. вывод
8K
Цена
Вход$1.20за 1 млн токенов
Выход$1.20за 1 млн токенов
Вход → Выход
ТекстТекст
4 параметров
Sonar Pro
perplexity/sonar-pro

Perplexity's advanced search-augmented model. Returns grounded answers with citations.

perplexity
Контекст
200K
Макс. вывод
8K
Цена
Вход$3.60за 1 млн токенов
Выход$18.00за 1 млн токенов
Вход → Выход
ТекстТекст
4 параметров
Sora 2
openai/sora-2

Flagship video generation with synced audio.

openai
Контекст
--
Макс. вывод
--
Цена
Запрос$0.120за запрос
720x1280 / 1280x720$0.120за секунду
Вход → Выход
ТекстИзображениеВидео
4 параметров
Sora 2 Pro
openai/sora-2-pro

Most advanced synced-audio video generation.

openai
Контекст
--
Макс. вывод
--
Цена
Запрос$0.360за запрос
720x1280 / 1280x720$0.360за секунду
Вход → Выход
ТекстИзображениеВидео
4 параметровещё 1 цен
Step 3.5 Flash
stepfun/step-3.5-flash

StepFun Step 3.5 Flash — fast and efficient model for everyday tasks.

stepfun
Контекст
131K
Макс. вывод
33K
Цена
Вход$0.240за 1 млн токенов
Выход$0.960за 1 млн токенов
Вход → Выход
ТекстТекст
6 параметров
text-embedding-3-large
openai/text-embedding-3-large

OpenAI text-embedding-3-large — high-quality embedding model with up to 3072 dimensions.

openai
Контекст
8K
Макс. вывод
--
Цена
Вход$0.156за 1 млн токенов
Вход → Выход
Текстembedding
4 параметров
text-embedding-3-small
openai/text-embedding-3-small

OpenAI text-embedding-3-small — fast, low-cost embedding model with up to 1536 dimensions.

openai
Контекст
8K
Макс. вывод
--
Цена
Вход$0.024за 1 млн токенов
Вход → Выход
Текстembedding
4 параметров
TTS-1
openai/tts-1

Text-to-speech model optimized for speed.

openai
Контекст
--
Макс. вывод
--
Цена
Запрос$18.00за запрос
Вход → Выход
ТекстАудио
4 параметров
TTS-1 HD
openai/tts-1-hd

Text-to-speech model optimized for quality.

openai
Контекст
--
Макс. вывод
--
Цена
Запрос$36.00за запрос
Вход → Выход
ТекстАудио
4 параметров
Vidu 2 Image-to-Video
zhipu/vidu2-image

Zhipu AI Vidu 2 Image-to-Video — 4s 1280×720 video from image + text prompt (cost-optimized).

zhipu
Контекст
--
Макс. вывод
--
Цена
Запрос$0.2616за запрос
Вход → Выход
ИзображениеТекстВидео
6 параметров
Vidu 2 Reference
zhipu/vidu2-reference

Zhipu AI Vidu 2 Reference — 4s 1280×720 video conditioned on 1+ reference images. Pricing/reference-count details pending ops re-verification against docs.bigmodel.cn.

zhipu
Контекст
--
Макс. вывод
--
Цена
Запрос$0.2616за запрос
Вход → Выход
ИзображениеТекстВидео
7 параметров
Vidu 2 Start-End
zhipu/vidu2-start-end

Zhipu AI Vidu 2 Start-End — 4s 1280×720 video interpolating between first and last frame.

zhipu
Контекст
--
Макс. вывод
--
Цена
Запрос$0.2616за запрос
Вход → Выход
ИзображениеТекстВидео
5 параметров
Vidu Q1 Image-to-Video
zhipu/viduq1-image

Zhipu AI Vidu Q1 Image-to-Video — 5s 1920×1080 video from image + text prompt.

zhipu
Контекст
--
Макс. вывод
--
Цена
Запрос$0.5208за запрос
Вход → Выход
ИзображениеТекстВидео
5 параметров
Vidu Q1 Start-End
zhipu/viduq1-start-end

Zhipu AI Vidu Q1 Start-End — 5s 1920×1080 video interpolating between first and last frame.

zhipu
Контекст
--
Макс. вывод
--
Цена
Запрос$0.5208за запрос
Вход → Выход
ИзображениеТекстВидео
5 параметров
Vidu Q1 Text-to-Video
zhipu/viduq1-text

Zhipu AI Vidu Q1 Text-to-Video — 5s 1920×1080 video from text prompt.

zhipu
Контекст
--
Макс. вывод
--
Цена
Запрос$0.5208за запрос
Вход → Выход
ТекстВидео
6 параметров
Voxtral TTS
mistral/voxtral-tts

Mistral's 2026-03 multilingual text-to-speech model (4B parameters, open-weight). 9 languages, low-latency streaming, 30+ preset voices. Supports custom voice profiles via reference audio.

mistral
Контекст
--
Макс. вывод
--
Цена
Запрос$14.40за запрос
Вход → Выход
ТекстАудио
3 параметров
Wan 2.2 T2I Flash
wan/wan2.2-t2i-flash

Alibaba Wan (通义万相) 2.2 text-to-image — fast tier. Async via /v1/jobs (img_ prefix).

wan
Контекст
--
Макс. вывод
--
Цена
Изображение$0.048за изображение
Per image$0.048за изображение
Вход → Выход
ТекстИзображение
4 параметров
Wan 2.2 T2I Plus
wan/wan2.2-t2i-plus

Alibaba Wan 2.2 text-to-image — premium tier. Higher fidelity, longer generation time.

wan
Контекст
--
Макс. вывод
--
Цена
Изображение$0.096за изображение
Per image$0.096за изображение
Вход → Выход
ТекстИзображение
4 параметров
Wan2.2 Image-to-Video
wan-ai/wan2.2-i2v

SiliconFlows Wan2.2 model for image-to-video generation with motion synthesis

wan-ai
Контекст
--
Макс. вывод
--
Цена
Запрос$60.00за запрос
Вход → Выход
ИзображениеТекстВидео
4 параметров
Wan2.2 Text-to-Video
wan-ai/wan2.2-t2v

SiliconFlows Wan2.2 model for text-to-video generation with up to 10-second output

wan-ai
Контекст
--
Макс. вывод
--
Цена
Запрос$60.00за запрос
Вход → Выход
ТекстВидео
4 параметров
Whisper
openai/whisper-1

General-purpose speech recognition model.

openai
Контекст
--
Макс. вывод
--
Цена
Запрос$0.0072за запрос
Вход → Выход
АудиоТекст
5 параметров
Поддержка