供应商简介: GroqGroq 研发定制 LPU(语言处理单元)芯片用于 AI 推理。其云端 API 提供业界最快速度 — 首 token 延迟低于 100ms,吞吐量超过 300 tokens/秒 — 运行 Llama 4、Llama 3.3、Qwen3 等热门开源模型。

← 全部供应商

Groq

美国4 个模型

LPU 驱动推理 — 全球最快的 AI 推理

Groq 研发定制 LPU(语言处理单元)芯片用于 AI 推理。其云端 API 提供业界最快速度 — 首 token 延迟低于 100ms,吞吐量超过 300 tokens/秒 — 运行 Llama 4、Llama 3.3、Qwen3 等热门开源模型。

  • 超快推理
  • 开源模型
  • 工具调用
  • 低延迟
超快推理开源模型工具调用低延迟
客服支持