G

AI Tool

Groq

低延迟推理与兼容 OpenAI 客户端的 GroqCloud API

Groq 运营 GroqCloud,通过兼容 OpenAI 的 HTTP API 提供托管模型(官网示例将 OpenAI 客户端的 base_url 设为 https://api.groq.com/openai/v1)。官方宣传侧重 LPU 推理架构与全球机房部署,开发者可通过控制台获取 API 密钥并管理接入。

分类 开发者工具
价格 按量计费 / 以控制台为准
平台 Web / API
inferenceapilpu

使用场景

  • 通过替换 base_url 与 API 密钥迁移 OpenAI 客户端
  • 需要更快 token 吞吐的聊天或 Agent 服务
  • 在定价匹配工作负载时控制推理成本

主要功能

  • 兼容 OpenAI 客户端示例(base_url: https://api.groq.com/openai/v1,见 groq.com)
  • GroqCloud 托管模型目录与控制台接入
  • 官网描述全球数据中心以降低推理延迟

相关推荐

相关推荐

3 收录条目