Skill Entry

错误预算策略起草

依据 Google SRE Workbook 附录示例,把错误预算写成可执行的治理文档:界定目标与非目标、滚动窗口内的冻结与放行规则、事故占用预算阈值对应的复盘与整改要求,以及预算口径争议时的升级路径,便于产品与研发对「可靠性 vs 迭代速度」达成共识。

分类 运营
平台 Google SRE Workbook / Codex
发布时间 2026-05-13
reliabilityslopolicy

使用场景

  • 制定公司级可靠性制度需要把「何时停发」写清楚
  • 事故复盘暴露大家对冻结触发条件理解不一致
  • 跨团队共享 SLO 时需要统一的预算消耗与例外条款
  • 外部依赖故障是否计入本方预算存在争议
  • 监控分类错误导致预算失真需要仲裁流程

主要功能

  • 写明适用范围与服务边界
  • 列出目标(降低重复伤害用户)与非目标(不以惩罚为目的)
  • 约定观测窗口长度并把冻结条件绑定到书面 SLO
  • 写明允许的紧急变更类别(最高优先级缺陷、安全补丁等)
  • 写入单次事故占用预算阈值及复盘产出要求(对齐附录示例阈值思路)
  • 指定争议升级负责人或委员会并完成评审签发

相关推荐

相关推荐

3 收录条目