将 LangSmith 可观测文档落成可重复的线上故障流程:从失败 run 或 thread 出发,用 UI 或 MCP(fetch_runs、get_thread_history)还原 Prompt、工具调用与错误,再用文档中的 FQL 过滤缩小范围;强调字符预算分页,并区分 Cloud OAuth Remote MCP 与自建 LANGSMITH_ENDPOINT。
使用场景
- RAG 路由 5xx 或空回复
- 单会话违反政策
- Prompt 变更后延迟升高
- 工具调用越权评审
- trace 计费审计
主要功能
- 记录项目、run UUID、thread、版本与时间窗
- 用 fetch_runs 或 UI 打开根 run
- 分页拉全 thread/trace 载荷
- 按 span 归因到检索、工具、模型或下游
- 对比 Prompt Hub 最近良好 revision
- 写明缓解与 eval 防回归计划
相关推荐
相关推荐
3 收录条目
生产环境故障排查
在线上故障诊断的结构化方法,涵盖日志分类、指标峰值关联、发布窗口过滤和安全复现步骤。
Agentic 编排效率声明尽职核查
将 Agentic 编排与效率叙事整理为清单。引用 CNBC 2026-06-03:Perplexity CEO 谈每瓦每用户 token 价值(文中 most taken value per watt per user);Windows Personal Computer;估值约 200 亿 vs Anthropic/OpenAI;年化收入约三倍——不作内部规划数。
企业 AI token 支出声明尽职核查
将企业 AI token 预算相关头条整理为财务/采购清单:区分融资估值叙事与 CFO 可核验的运营指标(供应商账单、模型组合效率、团队归因、是否用 frontier 模型做低价值任务)。引用 CNBC 2026-06-04:Ramp 融资 7.5 亿美元、估值 440 亿美元(ICONIQ、GIC、Ontario Teachers' Pension Plan 领投,约 +38%);CEO Eric Glyman 称年化收入超 10 亿美元且自由现金流为正;服务 7 万家企业;Glyman 称 token 构成支出「第三支柱」、多数 CFO 未在年度计划中为陡峭增长留预算;在 Ramp 客户中 AI 支出占收入比最高者收入增长 12%、最低者持平;并称 tokenmaxxing 时代接近尾声——不把媒体报道当作内部预算批复。