Skills

Skills

以「可执行」为导向整理提示与工作流:从需求澄清、交付与重构,到线上排障与协作评审。可按场景筛选,并对照站内工具与平台能力落地。

多区域 LLM 提供商就绪度核查

运营

将出口管制与多厂商路由整理为规划清单:记录主/备路(含 Helicone、LiteLLM Router)、量化区域封锁敞口,并在管理层对某市场「零预期」时与财务口径一致;含法务会签、故障演练与上线前证据。

LiteLLM Router 回退就绪度核查

运营

将 LiteLLM 路由文档转化为上线前清单:核对主/备部署、重试与负载策略;经 Proxy 时验证虚拟密钥与费用;通过可控主路故障演练确认回退触发;若用 MCP Gateway 则检查 store_model_in_db 与 SEP-986 命名。

LangSmith 生产 trace 排障手册

调试与排障

将 LangSmith 可观测文档落成可重复的线上故障流程:从失败 run 或 thread 出发,用 UI 或 MCP(fetch_runs、get_thread_history)还原 Prompt、工具调用与错误,再用文档中的 FQL 过滤缩小范围;强调字符预算分页,并区分 Cloud OAuth Remote MCP 与自建 LANGSMITH_ENDPOINT。

OWASP GenAI LLM Top 10(v1.1)风险核查清单

安全

将 OWASP GenAI 项目组维护的《大型语言模型应用 Top 10》公开分类(社区页面当前称为 v1.1,自 LLM01 提示注入延伸至 LLM10 模型窃取)转写为可逐项打勾的工程设计清单,覆盖 RAG、工具调用链、插件宿主、持续学习与托管推理等架构。每个风险域的叙述与缓解方向与 genai.owasp.org/项目维基对「提示操控、未验证输出、语料或训练投毒、滥用算力型 DoS、依赖与模型供应链、敏感信息回声、特权工具设计、代理自主性失控、对模型结论的过度信赖、专有模型与权重被外部复制」等条目描述保持一致,并强调将策略控制、观测与安全左移结合,而非仅依赖单次渗透测试结论。

事故复盘触发与根因分布(附录 C)

运营

依据 Google SRE Workbook「附录 C - Results of Postmortem Analysis」,说明为何需在组织内统一事故的「触发维度」与「根因类目」两组标签:附录基于大量历史复盘样本列出常见 outage 触发因素占比——如二进制推送约 37%、配置推送约 31%,以及用户行为、管线、提供商变更、性能衰退、容量、硬件等分项;并就根因给出软件缺陷约 41.35%、研发流程失效约 20.23%、复杂系统行为约 16.90%、部署计划约 6.74%、网络故障约 2.75%等分布(均为附录所述统计区间内的汇总)。落地时应沿用其分类颗粒度并结合自身事故库重算权重,而非照搬数字。

示例 SLO 文档起草

运营

依据 Google SRE Workbook 附录《Example SLO Document》,把示范性「游戏服务 API / HTTP / 分数管道」的写法抽象为可落地的文档模板:先写清用户旅程与数据来源,再选定滚动观测窗口(示例为四周),为每一条 SLI(可用性剔除 5xx、延迟阈值、读取新鲜度、探针正确性、批任务完整性等)写清分子与分母的统计口径并给出目标百分比,解释目标选取与取整惯例,分项计算误差预算并与《示例错误预算策略》联动,最后用 clarifications/caveats 记录 ELB/SYN 探测等盲点。套用模板时需替换为你们自己的业务指标与数据来源。

错误预算策略起草

运营

依据 Google SRE Workbook 附录示例,把错误预算写成可执行的治理文档:界定目标与非目标、滚动窗口内的冻结与放行规则、事故占用预算阈值对应的复盘与整改要求,以及预算口径争议时的升级路径,便于产品与研发对「可靠性 vs 迭代速度」达成共识。

NIST AI 风险管理框架(AI RMF 1.0)Govern/Map/Measure/Manage 执行清单

规划

依据美国国家标准与技术研究院(NIST)公开发布的《人工智能风险管理框架》AI RMF 1.0(出版物编号 NIST.AI.100-1;DOI https://doi.org/10.6028/NIST.AI.100-1),把四类核心职能——Govern(治理)、Map(情境梳理)、Measure(度量与评估)、Manage(管理与响应)——整理成可被跨职能团队逐项签字的核查表:官方说明该框架定位为自愿采纳,并要求把可信性考量纳入设计、开发、部署与评价流程。配套的 Playbook、路线图及对照索引托管在可信与负责任 AI 资源中心(airc.nist.gov)。面向生成式与基础模型工作负载时,应同步参考《生成式人工智能概要》(NIST AI 600-1;2024-07-26;DOI https://doi.org/10.6028/NIST.AI.600-1)将典型风险与控制建议映射进来。本条为工程化模版,不提供法律/审计定论。

编写与维护技能文档

写作

规范 SKILL.md 的编写、维护与验证流程,确保技能触发条件明确、步骤可执行、结果可验收,减少同类请求下输出不一致的问题。

使用 LLM 结构化输出做契约设计

编程

先列出业务必须的字段并写成 schema(类型、required、枚举等),按厂商文档开启结构化输出;每次返回在服务端用同一 schema 校验后再进业务逻辑;对拒答或校验失败打日志并迭代提示词或拆分 schema。适用于抽取、向导状态、工具参数序列化等场景。

Maintaining Cursor Project Rules

编程

Follow Cursor's official Rules documentation when you want persistent Agent guidance tied to a repository. Project rules encode architecture expectations, risky-folder guardrails, or repeatable workflows; Cursor applies them via Always Apply, intelligent relevance, glob-scoped attachments, or manual @mentions. Use .mdc frontmatter for finer control and reference templates with @file instead of pasting large snippets.

Structured AI meeting notes

写作

将原始会议记录转换为结构化、可操作的笔记,保留决策日志、分配的行动项和关键上下文,以便未来 AI 检索使用。该技能弥合了会议讨论内容与 AI 代理在数天或数周后根据会议结果行动所需信息之间的鸿沟。

生产故障应急响应

运营

从检测到解决的生产故障处理结构化流程——涵盖严重性评估、团队协调、沟通模板和事后分析要求。

Context-Aware QA Skill

研究

Context-Aware QA is a prompting technique where an AI model is instructed to retrieve and cite authoritative sources before answering factual questions. By combining retrieval-augmented generation (RAG) with explicit verification instructions, it dramatically reduces hallucinations in production AI systems.

生产环境故障排查

调试与排障

在线上故障诊断的结构化方法,涵盖日志分类、指标峰值关联、发布窗口过滤和安全复现步骤。

安全升级依赖

维护

升级 npm/pip/Cargo 依赖的结构化检查清单,涵盖 changelog 分析、semver 风险评估、lockfile 处理和冒烟测试,确保不破坏生产环境。

RAG 管道构建

研究

构建检索增强生成管道:嵌入分块策略、向量存储选择、混合搜索融合和重排序,使智能体能够基于您的文档回答而非产生幻觉式的通用响应。

多智能体交接设计

规划

设计专业智能体之间清晰的交接协议,使工作能够在规划者、编码者、审查者和执行者之间传递而不丢失上下文或产生循环依赖。

从代码生成文档

写作

直接从代码中提取架构决策、API 契约和使用模式来生成准确的文档——保持文档与实现同步,而非将其视为单独的产物。

网站 SEO 审计

运营

通过自动化爬取、Lighthouse 检查和结构化输出诊断整个网站的索引、可抓取性和页面 SEO 问题——在人工审核之前呈现带有优先级排序的可操作发现。

智能体工作流设计

规划

用明确的输入、输出、备选方案和交接协议来构建多步骤智能体任务,使智能体能可靠地完成复杂工作流,而不会在遇到第一个障碍时就停下。

代码库索引构建

编程

构建并维护代码库的语义索引,使智能体能检索相关上下文——文件关系、符号使用、历史决策——而无需在每次查询时重新解析所有内容。

AI 产品需求文档撰写

写作

写出能让 AI 智能体可靠执行的产品需求文档——对约束、边缘情况和验收标准都明确说明,最大限度减少你想要的和智能体实际构建之间的差距。

AI 生成代码的安全审查

安全

审查 AI 生成的代码是否存在注入风险、凭证泄露、依赖漏洞和访问控制缺陷——捕捉智能体在优化功能而非安全性时容易遗漏的问题。

微调准备

研究

为微调整理、清洗与格式化训练数据集:去重、质量过滤与输出格式化——让最终模型在你关心的行为上有真实提升。

评测与基准

运营

构建评测套件:带基准答案的自动化评分与回归检测,让团队在模型或提示词变更上线前就知道效果有没有提升,而不是靠感觉。

多 Agent 编排

自动化

把多个专业 Agent 协调到同一任务:通过显式交接、冲突解决与结果汇总,让并行工作保持连贯而不是各自为战。

AI 成本优化

运营

审计 Token 用量、模型选择、缓存策略与提示压缩,让团队在大规模 AI 功能下不失控——对高流量 Agent 流水线尤其关键。

提示词工程

研究

用明确的上下文、角色定位、输出约束与引用要求来撰写提示词,让模型回复一致、可落地、可追溯到来源,适合需要进入流水线的 API 调用。

RAG 实现

编程

构建检索增强生成流水线:文档分块、向量化、索引、排序与答案合成——让助手从自己的数据出发回答,而不是靠泛化训练知识。

可观测性基线

运营

在让 Agent 接管发布前,先约定黄金信号、SLO 窗口与面板检查项——助手才知道何谓「健康」,而不是从嘈杂日志里猜。

事故复盘写作

运营

在故障后沉淀时间线、影响面、促成因素与可跟踪的后续项,让团队从事故里学习,而不是重复同一种意外。

把库文档接进闭环

研究

让助手对齐你真实在用的 README、changelog 与类型导出——借助 MCP 文档检索或粘贴片段——重构从真实签名出发,而不是靠「好像记得」的接口。

契约测试

编程

用消费者驱动的契约把服务间 API 预期钉在 CI 里,重构先在流水线失败,而不是留到联调周末才爆。

金丝雀发布

运营

先把一小部分流量打到新构建,看错误预算与延迟,再扩面或回滚;Agent 动发布链路时,意外也更可控。

结构化日志

运营

约定少量日志字段(请求 ID、用户 ID、功能开关、延迟分桶),让线上排障不靠 grep 一堆格式不一的 printf。

威胁建模

研究

上线前把数据流与信任边界走一遍:谁可以调什么、密钥从哪到哪、哪些故障会直接暴露给客户,让安全讨论从图开始,而不是截止前才掏清单。

安全重构

编程

把重构拆成有测试兜底的小步:改名、抽取、搬迁,在改善结构的同时把行为钉死。

Humanizer(去 AI 腔)

写作

依据维基「AI 写作迹象」等规则,削弱夸大重要性、堆砌 -ing、破折号滥用、机器人收尾语等问题,并在定稿前做「仍像 AI 吗」的二次审阅。

性能分析与剖析

运营

结合链路追踪、火焰图与系统指标先定位真实瓶颈,再动代码,避免凭感觉做微优化却测不到收益。

中文去 AI 腔

写作

清理中文稿里的翻译腔、口号式收尾、抽象词堆叠和僵硬 AI 节奏,同时保留有用事实,不把稿子改成空泛散文。

来源核验

研究

在内容进入目录前,检查说法是否有一手来源、带日期的官方页面或可信二手来源支撑,避免把营销转述写成事实。

内容刷新

运营

定期扫一遍旧工具、MCP、技能和资讯条目,处理过期价格、失效文档链接与弱摘要,不让目录慢慢变旧。

SEO 收录检查

运营

发布内容批次前检查 sitemap、canonical、hreflang、robots 和 Search Console 信号,尤其适合现在这种双语静态站。

API 设计与版本策略

编程

在实现固化之前,先定义 REST 或 RPC 的资源模型、错误形态、分页与弃用规则,避免客户端被不可控的破坏性变更拖垮。

发起代码评审

写作

在主要改动完成后发起审查,突出风险面、测试覆盖与发布影响,帮评审者把精力放在刀刃上。

执行实施计划

编程

按书面计划顺序推进,在检查点核对假设是否仍成立,适合 spec 驱动开发与多阶段重构。

撰写实施计划

写作

在写代码之前,把已确认需求拆成带检查点、可验证交付物的分步实施计划,并标清会动到的文件与风险面。

Git 工作树隔离

运营

用额外 worktree 承载并行实验或长任务,减轻主工作区 stash 堆积与上下文切换成本。

测试驱动开发(TDD)

编程

用红绿重构循环把行为钉在测试上,适合新功能、回归缺陷和需要安全网的重构场景。

并行代理调度

自动化

把可并行的调研、文件批处理或模块实现拆给多个代理,并约定清晰的汇总与冲突解决责任人。

系统化调试

运营

用假设—验证—最小复现替代拍脑袋,适合线上事故、构建抖动和难以复现的行为回归。

子代理驱动开发

自动化

在较大计划下由子代理分片执行,适合单线程太慢但仍需要单一集成与验收负责人的场景。

图像生成与编辑

设计

生成或编辑位图素材,用于封面、概念稿与快速视觉探索;交付物是栅格图而非纯代码矢量时优先使用。

收尾开发分支

运营

在开发完成后统一处理验证、提交粒度、推送与分支生命周期,明确合并、压缩或后续工单。

插件脚手架

自动化

快速生成插件目录、清单与入口文件,让 Codex 或编辑器扩展从第一天起就结构清晰、便于评审。

动手前的头脑风暴

研究

在写代码前澄清目标、约束与方案选项,避免在产品与交互决策上把自己逼进死角。

前端界面设计

设计

打造有辨识度且可落地的前端界面:版式节奏、字体层次、色彩与动效统一,避免「AI 味」模板感。

交付前验证

运营

在宣称「完成」之前先跑测试、构建或约定的人工检查,让「完成」等于在真实环境里验证过。

OpenAI 文档检索

研究

优先引用 OpenAI 官方文档与 API 参考,在集成模型与接口时减少二手博客带来的版本错误。

接收代码评审

写作

结构化处理评审意见:区分风格建议与必须修复项,让合并讨论聚焦风险与证据。

Using Postgres MCP for Database Exploration

MCP工作流

本 Skill 指导你如何将 AI agent 连接到 PostgreSQL 数据库,并使用自然语言完成 Schema 检查、数据查询和结构化分析。通过 MCP 协议,AI 可以直接访问数据库元数据,无需手动编写 SQL 即可完成数据探索任务。