Groq

Name: Groq
Brand: Groq

美国4 个模型

LPU 驱动推理 — 全球最快的 AI 推理

Groq 研发定制 LPU（语言处理单元）芯片用于 AI 推理。其云端 API 提供业界最快速度 — 首 token 延迟低于 100ms，吞吐量超过 300 tokens/秒 — 运行 Llama 4、Llama 3.3、Qwen3 等热门开源模型。

超快推理开源模型工具调用低延迟