供应商简介: Groq — Groq 研发定制 LPU(语言处理单元)芯片用于 AI 推理。其云端 API 提供业界最快速度 — 首 token 延迟低于 100ms,吞吐量超过 300 tokens/秒 — 运行 Llama 4、Llama 3.3、Qwen3 等热门开源模型。
← 全部供应商
Groq
美国4 个模型LPU 驱动推理 — 全球最快的 AI 推理
Groq 研发定制 LPU(语言处理单元)芯片用于 AI 推理。其云端 API 提供业界最快速度 — 首 token 延迟低于 100ms,吞吐量超过 300 tokens/秒 — 运行 Llama 4、Llama 3.3、Qwen3 等热门开源模型。
- ✓超快推理
- ✓开源模型
- ✓工具调用
- ✓低延迟
超快推理开源模型工具调用低延迟