B

AI Tool

Baseten

用 Truss、Model APIs 与 OpenAI 兼容端点训练、部署并提供模型推理服务

Baseten 在 docs.baseten.co 文档化训练与推理平台:团队可通过开源 Truss 框架部署模型,或不经自建基础设施直接调用托管 Model APIs。仅 config.yaml 的 Truss 部署指向 Hugging Face 检查点、GPU 与 TensorRT-LLM 等引擎;truss push 构建优化容器并暴露 OpenAI 兼容端点。自定义架构在 model.py 中用 Model 类的 load/predict 实现。Model APIs 以 BASETEN_API_KEY 即时调用目录模型。

分类 开发者工具
价格 按用量计费推理与训练(见 baseten.co/pricing)
平台 Web / API / Python / CLI
inferencedeploymenttruss

使用场景

  • 无需 Dockerfile 发布 Hugging Face LLM
  • Model APIs 原型后上线微调权重
  • 复用 OpenAI SDK 仅换 base URL
  • predict 中写自定义逻辑
  • 对比 TensorRT-LLM 与 PyTorch 基线

主要功能

  • Truss config.yaml 部署受支持的开源 LLM
  • 引擎化部署提供 OpenAI 兼容 API
  • model.py 自定义 predict 逻辑
  • development 与 production 晋升路径
  • Model APIs 无需私有部署即可调用

相关推荐

相关推荐

3 收录条目