R

AI Tool

RunPod

面向 AI 推理的无服务器 GPU 端点与 Pods API

RunPod 在 docs.runpod.io 提供无服务器 GPU 平台:用 Runpod SDK 编写 handler、Docker 部署,经 api.runpod.ai/v2/{ENDPOINT_ID}/runsync 调用,Bearer RUNPOD_API_KEY 鉴权;含 Pods 持久 GPU 与 REST API。

分类 开发者工具
价格 Serverless 按秒计费;Pods 按 GPU 小时
平台 Web / API / Python / Docker
gpuserverlessinference

使用场景

  • 无空闲成本的推理扩缩
  • 本地原型后 Docker 部署
  • Pods 长训 + Serverless 突发
  • REST 自动化
  • LLM 流式输出

主要功能

  • /runsync、/run、/status、/stream
  • Runpod SDK handler
  • 负载均衡端点
  • Pods 与网络卷
  • REST OpenAPI

相关推荐

相关推荐

3 收录条目