开源 LLM 工程平台:链路追踪、评测与 Prompt 版本管理
Langfuse 提供面向大模型与 Agent 的可观测性:接入 trace/span、管理 prompt 与数据集,支持云托管或自建,便于排查多步工具调用、对比 prompt 并跟踪线上指标。
使用场景
- 定位工具链深处失败的 Agent 运行
- 按版本统计延迟与 token
- 从生产 trace 构造评测集
- 用固定集对比 prompt 变更
- 平台团队统一查看预发与线上行为
主要功能
- 多步 LLM / Agent 会话的 trace 与视图
- Prompt 版本化与对比
- 数据集与离线评测、回归
- Python / JavaScript SDK
- 可自建部署以满足数据驻留
相关推荐
相关推荐
3 收录条目
Postgres MCP
Postgres MCP 是一款连接 AI agents 与 PostgreSQL 数据库的 Model Context Protocol 服务器。通过 MCP 协议暴露数据库 Schema 检查、行查询、SQL 执行和 RPC 调用等核心能力,使 AI 在对话中直接完成数据库相关任务。支持即插即用连接 Claude Desktop、Cursor、Codex 等主流 MCP 客户端,无需额外配置即可开始使用。
Google Antigravity
Google Antigravity is an agentic development platform announced on the Google Developers Blog (November 2025). It pairs a familiar AI-assisted editor with a Manager Surface where developers spawn and observe agents working asynchronously across editor, terminal, and browser. Agents produce Artifacts—such as task lists, implementation plans, screenshots, and browser recordings—for review instead of relying only on raw tool logs. Public preview is offered at no cost for individuals on macOS, Windows, and Linux, with model choice including Gemini 3 Pro plus third-party models such as Claude Sonnet 4.5 and OpenAI GPT-OSS as described by Google.
MemGPT
MemGPT 用分层记忆存储让长时间运行的 Agent 记住关键事实、用户偏好与对话历史,不受上下文限制。适合需要跨会话连贯性的个人 AI 助手与企业级 Copilot。