N

AI Tool

NVIDIA NIM

容器化推理微服务,提供 OpenAI 兼容 API

NVIDIA NIM 在 docs.api.nvidia.com/nim 与 docs.nvidia.com/nim 文档化性能优化推理微服务:通过容器暴露行业标准 API(OpenAI 兼容的 /v1/chat/completions、/v1/completions、/v1/responses,以及 Anthropic 兼容的 /v1/messages),后端可为 TensorRT-LLM、vLLM 或 SGLang。可在云、数据中心或 RTX 工作站自托管,也可经 Developer Program 使用托管 NIM API 做原型。自托管容器提供 /v1/health/ready 与 /v1/metrics 等管理端点。

分类 开发者工具
价格 Developer Program 托管 API 原型;生产自托管通常需 NVIDIA AI Enterprise
平台 Web / API / Docker / Kubernetes
inferencegpucontainers

使用场景

  • OpenAI 客户端改 base_url 指向本地 NIM
  • Kubernetes 部署并抓 Prometheus 指标
  • 托管 API 验证后再自托管
  • Anthropic 风格客户端走 /v1/messages
  • 按基础设施选择 TRT-LLM 或 vLLM

主要功能

  • OpenAI 兼容 chat/completion/responses
  • Anthropic 兼容 /v1/messages
  • 存活/就绪探针
  • 多场景模型目录
  • Developer Program 托管 API 原型

相关推荐

相关推荐

3 收录条目