Skills

将 AI News 2026 年 6 月 24 日关于 Samsung Electronics 扩大员工 ChatGPT Enterprise 与 Codex 访问的报道，转为安全、采购与劳动力治理核查清单。工作流区分已核实事实——OpenAI 称覆盖韩国全部 Samsung Electronics 员工及全球 Device eXperience 员工；Samsung 计划在软件开发、营销、产品开发、制造等职能用于检索、起草、创意、数据解读与代码；2023 年因敏感内部信息上传外部 AI 而限制，现改用含数据保护、用户访问与安全管理的 ChatGPT Enterprise；Codex 支持代码编写/审查/调试及内部工具、网站、原型与自动化工作流；OpenAI 称 Codex 每周用户超 500 万、韩国 Codex WAU 自 2026 年 2 月 1 日起近增 800%；OpenAI Korea GM Harrison Kim 称系 OpenAI 最大企业部署之一；2025 年 10 月 Stargate 内存合作与 Samsung SDS 经销/咨询关联单独引用——与内部 rollout 决策分离。AI News 亦引 Deloitte 企业 AI 采纳调查中 66% 生产力提升与 53% 决策洞察改善。

OpenAI Jalapeño 推理芯片尽职核查

将 Reuters 经 Yahoo Tech 2026 年 6 月 24 日关于 OpenAI 与 Broadcom Jalapeño 定制推理芯片的报道，转为基础设施、财务与采购核查清单。工作流区分已核实事实——OpenAI 展示与 Broadcom 合作设计的首款定制 AI 芯片，面向 inference；Broadcom CEO Hock Tan 告诉 Reuters 性能可比 Nvidia Blackwell 或 Google TPU；硬件负责人 Richard Ho 称 Jalapeño 为 LLM 推理及未来 LLM 迭代设计；计划 2026 年底前部署，作为多代芯片计划第一步；Celestica 为 OpenAI 专用构建服务器；实验室样品在 GPT-5.3-Codex-Spark 上达到目标功耗/性能；约九个月设计周期送 TSMC 制造，AI 辅助设计环节；Tan 指 HBM 需求挤压定制 AI 芯片利润，SK Hynix 与 Samsung 供内存——与内部容量规划分离。Reuters 指 OpenAI 自 2023 年探索自研芯片，Anthropic 据 4 月报道亦考虑自研芯片。

Anthropic–Alibaba 蒸馏攻击尽职核查

将 CNBC 2026 年 6 月 24 日 Anthropic 致参议院银行委员会信函报道转为安全、法务与政策清单。区分已核实事实：指控 Alibaba 非法提取 AI 能力；6 月 10 日信称最大蒸馏攻击；4/22–6/5 间 2880 万次交互、约 2.5 万欺诈账户；无视 OSTP 警告；2 月 DeepSeek/Moonshot/MiniMax；Mythos/Fable 出口管制背景。Alibaba 未立即回应。

Five Eyes 前沿 AI 网络安全警告尽职核查

将 CNN 2026 年 6 月 23 日 Five Eyes 联合声明报道转为安全、法务与高管核查清单。区分已核实事实——五眼联盟警告前沿 AI 重大网络攻击距现实仅数月；声明称将根本改变攻防能力；敦促立即投资防御、升级/补丁、限制关键访问；防御性 AI 可更早发现漏洞——与内部管控决策。背景：Anthropic 外国公民禁令；美国 AI 监管框架空白。

SAP–Google 智能体商务架构尽职核查

将 AI News 2026 年 6 月 19 日 SAP 与 Google Cloud 智能体商务架构报道转为数据、零售运营与采购核查清单。区分已核实事实——78%/37%/39% SAP 研究、UCP、Business Data Cloud Connect + BigQuery 零拷贝、Engagement Cloud 多智能体、Gemini/Nano Banana 2 与 RCS、Shopping Assistant 实时库存——与内部 rollout 决策。

ChatGPT Enterprise 支出管控尽职核查

将 Reuters 经 Yahoo Tech 2026 年 6 月 18 日关于 ChatGPT Enterprise 用量分析与支出管控上线的报道，转为财务、IT 与采购核查清单。区分已核实产品事实——全球 admin console 展示 ChatGPT 与 Codex credits 用量、按用户/产品/模型细分、用量趋势与 top users、workspace 默认 credit 上限、按组限额与个别 override、员工自助查看用量并申请额外 credits、周四起可用——与组织仍需制定的内部政策。

ChatGPT 图像生成安全尽职核查

将 BBC 2026 年 6 月 17 日关于英国 AI 安全初创 Mindgard 对 ChatGPT 图像生成 red-teaming 的报道，转为安全、法务与发布治理核查清单。工作流区分已核实事实——Mindgard 轻微改动广泛传播的幽默 prompt，使最新公开 ChatGPT（GPT-5.4）生成色情或血腥暴力图像；创始人 Peter Garraghan（兰卡斯特大学教授）称输出血腥且有时色情，prompt 未指定主题；研究员 Jim Nightingale 称对结果感到震惊；BBC 见过含 Grim crime scene aftermath、abandoned in fear and restraint 等标题的样例；Mindgard 5 月首次告警 OpenAI 仅获自动回复，部分拦截后被绕过；OpenAI 经 BBC 联系后称已加 safeguards，并有多层图像保护、自动化、人工审核及禁止性暴力、非自愿 intimate content、CSAM 与 bypass 的政策；Mindgard 称小幅 prompt 变更仍可产出令人担忧内容，此前研究显示换脸 deepfake 仍可能；专家 Rumman Chowdhury（Humane Intelligence）指模型缺乏人类式意图理解；英国 AI Security Institute 此前在测试系统中发现 jailbreak；DSIT 称 safeguards 在改进但仍需更多工作——与内部图像模型发布决策分离。

Anthropic Mythos 出口管制指令尽职核查

将前沿模型出口管制头条整理为法务/安全清单。引用 CNN 2026-06-13：政府下令暂停外国公民使用 Mythos/Fable 5 后 Anthropic 全球下线；政府未给具体细节；Anthropic 指 Fable 5 jailbreak 演示轻微已知漏洞；反对行业化标准；Axios 称需商务部许可；上周 Fable 5 公开发布；涉供应链风险与诉讼。

前沿模型 token 价格战尽职核查

将前沿 LLM 定价头条整理为财务与采购清单。引用 WSJ 2026-06-11：OpenAI 考虑大幅下调 token 价格并预期 Anthropic 跟进；讨论仍不确定；IPO 前商业模式受审视；OpenAI 当周秘密递交 IPO；Altman Slack 称一年内上市（Information）。勿将泄露当现行价目。

欧盟 AI 法案第 50 条内容标注尽职核查

将欧盟生成式 AI 透明度头条整理为合规清单。引用 AI News 2026-06-16：委员会 6 月 10 日发布自愿准则，第 50 条自 8 月 2 日适用；准则可选签署但义务不可选；深度伪造与公共利益 AI 文本须标注，交互式 AI 须披露机器身份；Virkkunen 引述公众知情权；提供方机器可读标记、部署方可见标注；开放标准与欧盟图标；6 专家与 180+ 方参与；指南仍待发布、不足两月。

AI 芯片厂商债务融资尽职核查

将 AI 基础设施债务头条整理为财资与 IR 清单：区分 SEC 披露与匿名来源规模、对比存量债务与历史融资，并把募资用途表述与回购叙事分开。引用 CNBC 2026-06-15：Nvidia 周一 SEC 文件披露自 2021 年以来首次投资级公司债计划；消息人士称目标至少 200 亿美元（或接近 250 亿）；周一股价涨 3.5%、年内约涨 14%；并置于 Alphabet、Super Micro、Amazon 同业融资语境；长期债约 75 亿、短期约 10 亿，2021 年融资 50 亿，FY22 收入约 270 亿升至 FY26 2160 亿；发言人称用于一般公司用途含偿还/再融资；5 月股息 0.25 美元、800 亿回购、约将 50% 自由现金流返还股东、当季 FCF 490 亿。

AI 劳动力市场 JOLTS 声明尽职核查

将 AI 与就业头条整理为用工规划清单。引用 CNN 2026-06-02：4 月职位空缺 762 万（2024 年中以来最高），高于 3 月 689 万；招聘/裁员回落、自愿离职近六年新低；增幅逾 90% 来自专业与商业服务；自 2025 年 6 月以来首次空缺多于求职者；Noah Yosif 称数据或削弱「AI 大杀手」叙事；CNN 提示波动、修订与伊朗战争风险——不把单月 JOLTS 当作 AI 提振初级招聘证据。

区域性 AI 助手上线尽职核查

将平台助手发布头条整理为产品/法务清单：区分能力与区域可用性、第三方模型与监管争议。引用 Yahoo Tech 2026-06-08 WWDC：基于 Gemini 的 Siri AI beta；欧盟 iPhone/iPad/Watch 因 DMA 不上线，macOS/visionOS 27 可用；watchOS 欧盟需配对 iPhone；Federighi 称 iOS/iPadOS 欧盟无时间表；中国亦延迟；支持 iPhone 17/16、15 Pro、M4+ iPad、M3+ Mac。

Mythos 级前沿模型接入尽职核查

将 Mythos 级模型发布头条整理为安全与采购清单：区分 Claude Fable 5 公开护栏、Claude Mythos 5 可信接入层级与媒体能力 rhetoric。引用 BBC 2026-06-10：Anthropic 发布 Fable 5（4 月私下预览 Mythos 的公开版）；援引「Fable's capabilities exceed those of any model we've ever made generally available」与「releasing a model this capable comes with risks」；约 150 预览组获更少网络/生物限制的 Mythos 5；预览用户报告逾 1 万个关键漏洞；计划扩大可信接入；Jack Clark 对 Newsnight 称行业「有油门却没有刹车」；私市估值逼近 1 万亿美元——不把 hype 当作已签合同。

前沿 AI 实验室 IPO 申报声明尽职核查

将前沿模型实验室 IPO 头条整理为财务/治理清单：区分保密 S-1 事实、估值 rhetoric、员工 tender 流动性与同期竞争上市节奏。引用 CNBC 2026-06-08/09：OpenAI 向 SEC 保密递交 IPO 文件，官方发文称已提交保密 S-1、尚未决定时间、部分事项私营更易操作；CNBC 称估值超 8500 亿美元、或最快 2026 年 Q4 上市、与高盛/摩根士丹利合作、计划让员工按 8520 亿美元 post-money 估值 tender 售股；ChatGPT 周活超 9 亿；融资超 1800 亿仍为算力烧钱；递交在一周前 Anthropic 保密申报（估值 9650 亿）之后——不把媒体估值当作投资论点。

第三方 GPU 算力租赁声明尽职核查

将 hyperscaler/neocloud GPU 租赁头条整理为容量规划清单：区分月费与 GPU 数量、交付 SLA、终止条款及「桥接 vs 战略」容量表述。引用 CNBC 2026-06-05：Google 2026 年 10 月至 2029 年 6 月每月向 SpaceX 支付 9.2 亿美元，使用约 11 万块 Nvidia GPU 及 CPU/内存；9 月前以较低费用逐步 ramp；若 2026 年 9 月 30 日前未交付承诺 GPU，Google 可立即终止或在一月宽限期后按减量付费；2026 年 12 月 31 日后任一方可提前 90 天通知终止；Google Cloud 发言人称系满足 Gemini Enterprise 激增需求的桥接容量；此前 2 月 SpaceX 与 xAI 合并估值 1.25 万亿美元、5 月 Anthropic Colossus 1 协议；CNBC 指 SpaceX Q1 capex 101 亿（77 亿投向 AI）、AI 分部经营亏损 25 亿、收入 8.18 亿——不把 SEC 披露数字当作己方合同条款。

企业 AI token 支出声明尽职核查

将企业 AI token 预算相关头条整理为财务/采购清单：区分融资估值叙事与 CFO 可核验的运营指标（供应商账单、模型组合效率、团队归因、是否用 frontier 模型做低价值任务）。引用 CNBC 2026-06-04：Ramp 融资 7.5 亿美元、估值 440 亿美元（ICONIQ、GIC、Ontario Teachers' Pension Plan 领投，约 +38%）；CEO Eric Glyman 称年化收入超 10 亿美元且自由现金流为正；服务 7 万家企业；Glyman 称 token 构成支出「第三支柱」、多数 CFO 未在年度计划中为陡峭增长留预算；在 Ramp 客户中 AI 支出占收入比最高者收入增长 12%、最低者持平；并称 tokenmaxxing 时代接近尾声——不把媒体报道当作内部预算批复。

定制 AI 芯片财报声明尽职核查

将定制 AI 芯片厂商财报头条整理为财务/供应链清单：区分合并收入/EPS 与 AI 半导体子项、全年 AI 收入指引（上调/重申）及同期基础设施软件不及预期。引用 CNBC 2026-06-03：Broadcom 财季 Q2 收入 221.9 亿美元（预期 222.7 亿，同比 +48%），调整后 EPS 2.44（预期 2.40），AI 半导体收入 108 亿（同比翻倍以上），Q3 收入指引约 294 亿（预期 285.3 亿），基础设施软件 71.8 亿（预期 73.2 亿）；CEO Hock Tan 重申 2027 财年 AI 半导体收入超 1000 亿美元但未上调 2026 预测；点名 Anthropic、Google、Meta、OpenAI 等六大定制芯片客户；称将仅提供芯片而非完整集成 AI 系统——不把媒体报道当作采购承诺。

Agentic 编排效率声明尽职核查

将 Agentic 编排与效率叙事整理为清单。引用 CNBC 2026-06-03：Perplexity CEO 谈每瓦每用户 token 价值（文中 most taken value per watt per user）；Windows Personal Computer；估值约 200 亿 vs Anthropic/OpenAI；年化收入约三倍——不作内部规划数。

上市公司 AI 基础设施融资尽职核查

将上市公司 AI 基建融资头条整理为清单：区分股权组成部分（承销、ATM、私募）与 capex/债市背景。引用 CNBC 2026-06-01：Alphabet 拟售 800 亿股票（含 Berkshire 100 亿）投 AI 算力；需求超供给；capex 1800–1900 亿；hyperscaler 合计超 7000 亿——不作内部预算。

AI 订阅变现声明尽职核查

将消费级 AI 订阅公告整理为清单：试点国家、价格、免费层、capex 与分析师外推分开记录。引用 CNBC 2026-05-30：Meta 下月在新加坡、危地马拉、玻利维亚测试 7.99/19.99 美元/月并保留免费层；Q1 约 98% 收入来自广告；云业务在考虑之列；AI capex 1250–1450 亿；Wolfe 估 2027 约 30 亿、2030 约 160 亿——不作内部 forecast。

私营 AI 融资与估值声明尽职核查

将私营 AI 融资头条整理为核查清单：估值、募资、领投、此前承诺与 run-rate。引用 CNBC 2026-05-28：Anthropic 650 亿 H 轮、9650 亿估值，含 Amazon 50 亿此前承诺；高于 OpenAI 8520 亿；run-rate 470 亿——不作内部规划数。

超大规模云厂商采购承诺尽职核查

将多年云支出承诺与财报日协议整理为清单：区分头条金额与年均支出、历史修订协议及 AI GPU 占比。引用 CNBC 2026-05-27：Snowflake 五年 60 亿 AWS、Q1 业绩超预期、Natoma 收购价未披露。

AI 内存与 HBM 供应链声明尽职核查

将 AI 驱动存储短缺、HBM 需求与内存芯片万亿市值的公开说法整理为核查清单：区分分析师调价、年内涨幅与 agentic AI 表述和可观察供应信号。引用 CNBC：美光 2026-05-26 市值破万亿、瑞银目标价 535→1625 美元；SK 海力士 2026-05-27 加入万亿俱乐部、年内约涨 250%——不背书投资建议。

先进芯片路线图声明尽职核查

将公开半导体发布整理为核查清单：当厂商宣称新缩放定律、堆叠逻辑架构或纳米节点等效而无独立 benchmark 时，区分营销表述与量产就绪度，要求良率、热设计、封装与第三方验证证据——呼应 CNBC 报道华为 LogicFolding/τ Scaling Law 及分析师对无 EUV 情况下「1.4nm 等效」的质疑。并映射出口管制（ASML EUV）与 GPU 竞争格局。

AI 经济收益分配就绪度核查

将 AI 驱动财富与劳资关系整理为规划清单：记录 AI 增益是否转化为员工/公众收益、评估芯片股集中度风险、为 physical-AI 自动化前的劳资对话做准备；引用 CNBC 韩国副总理与三星罢工等公开报道作背景。

负责任 AI 无障碍数据审查

将 Microsoft Learn 负责任 AI 与无障碍修复整理为清单：核查生成式输出（图像/代码/UI）对视障等群体的刻板描绘、审计 dataset metadata、记录人在回路修复，并对齐人对 AI 结果负责的原则。

Agentic 编码供应商就绪度核查

在标准化 AI 编码栈前核查：SCM 状态页 incident、主备 Agent（Copilot/Cursor/Claude Code 等）、Braintrust 等 tracing 基线，以及托管与 Agent API 双故障演练；引用公开计费与 outage 报道。

多区域 LLM 提供商就绪度核查

将出口管制与多厂商路由整理为规划清单：记录主/备路（含 Helicone、LiteLLM Router）、量化区域封锁敞口，并在管理层对某市场「零预期」时与财务口径一致；含法务会签、故障演练与上线前证据。

LiteLLM Router 回退就绪度核查

将 LiteLLM 路由文档转化为上线前清单：核对主/备部署、重试与负载策略；经 Proxy 时验证虚拟密钥与费用；通过可控主路故障演练确认回退触发；若用 MCP Gateway 则检查 store_model_in_db 与 SEP-986 命名。

LangSmith 生产 trace 排障手册

调试与排障

将 LangSmith 可观测文档落成可重复的线上故障流程：从失败 run 或 thread 出发，用 UI 或 MCP（fetch_runs、get_thread_history）还原 Prompt、工具调用与错误，再用文档中的 FQL 过滤缩小范围；强调字符预算分页，并区分 Cloud OAuth Remote MCP 与自建 LANGSMITH_ENDPOINT。

OWASP GenAI LLM Top 10（v1.1）风险核查清单

将 OWASP GenAI 项目组维护的《大型语言模型应用 Top 10》公开分类（社区页面当前称为 v1.1，自 LLM01 提示注入延伸至 LLM10 模型窃取）转写为可逐项打勾的工程设计清单，覆盖 RAG、工具调用链、插件宿主、持续学习与托管推理等架构。每个风险域的叙述与缓解方向与 genai.owasp.org／项目维基对「提示操控、未验证输出、语料或训练投毒、滥用算力型 DoS、依赖与模型供应链、敏感信息回声、特权工具设计、代理自主性失控、对模型结论的过度信赖、专有模型与权重被外部复制」等条目描述保持一致，并强调将策略控制、观测与安全左移结合，而非仅依赖单次渗透测试结论。

事故复盘触发与根因分布（附录 C）

依据 Google SRE Workbook「附录 C - Results of Postmortem Analysis」，说明为何需在组织内统一事故的「触发维度」与「根因类目」两组标签：附录基于大量历史复盘样本列出常见 outage 触发因素占比——如二进制推送约 37%、配置推送约 31%，以及用户行为、管线、提供商变更、性能衰退、容量、硬件等分项；并就根因给出软件缺陷约 41.35%、研发流程失效约 20.23%、复杂系统行为约 16.90%、部署计划约 6.74%、网络故障约 2.75%等分布（均为附录所述统计区间内的汇总）。落地时应沿用其分类颗粒度并结合自身事故库重算权重，而非照搬数字。

示例 SLO 文档起草

依据 Google SRE Workbook 附录《Example SLO Document》，把示范性「游戏服务 API / HTTP / 分数管道」的写法抽象为可落地的文档模板：先写清用户旅程与数据来源，再选定滚动观测窗口（示例为四周），为每一条 SLI（可用性剔除 5xx、延迟阈值、读取新鲜度、探针正确性、批任务完整性等）写清分子与分母的统计口径并给出目标百分比，解释目标选取与取整惯例，分项计算误差预算并与《示例错误预算策略》联动，最后用 clarifications/caveats 记录 ELB/SYN 探测等盲点。套用模板时需替换为你们自己的业务指标与数据来源。

错误预算策略起草

依据 Google SRE Workbook 附录示例，把错误预算写成可执行的治理文档：界定目标与非目标、滚动窗口内的冻结与放行规则、事故占用预算阈值对应的复盘与整改要求，以及预算口径争议时的升级路径，便于产品与研发对「可靠性 vs 迭代速度」达成共识。

NIST AI 风险管理框架（AI RMF 1.0）Govern／Map／Measure／Manage 执行清单

规划

依据美国国家标准与技术研究院（NIST）公开发布的《人工智能风险管理框架》AI RMF 1.0（出版物编号 NIST.AI.100-1；DOI https://doi.org/10.6028/NIST.AI.100-1），把四类核心职能——Govern（治理）、Map（情境梳理）、Measure（度量与评估）、Manage（管理与响应）——整理成可被跨职能团队逐项签字的核查表：官方说明该框架定位为自愿采纳，并要求把可信性考量纳入设计、开发、部署与评价流程。配套的 Playbook、路线图及对照索引托管在可信与负责任 AI 资源中心（airc.nist.gov）。面向生成式与基础模型工作负载时，应同步参考《生成式人工智能概要》（NIST AI 600-1；2024-07-26；DOI https://doi.org/10.6028/NIST.AI.600-1）将典型风险与控制建议映射进来。本条为工程化模版，不提供法律／审计定论。

编写与维护技能文档

规范 SKILL.md 的编写、维护与验证流程，确保技能触发条件明确、步骤可执行、结果可验收，减少同类请求下输出不一致的问题。

使用 LLM 结构化输出做契约设计

先列出业务必须的字段并写成 schema（类型、required、枚举等），按厂商文档开启结构化输出；每次返回在服务端用同一 schema 校验后再进业务逻辑；对拒答或校验失败打日志并迭代提示词或拆分 schema。适用于抽取、向导状态、工具参数序列化等场景。

Maintaining Cursor Project Rules

Follow Cursor's official Rules documentation when you want persistent Agent guidance tied to a repository. Project rules encode architecture expectations, risky-folder guardrails, or repeatable workflows; Cursor applies them via Always Apply, intelligent relevance, glob-scoped attachments, or manual @mentions. Use .mdc frontmatter for finer control and reference templates with @file instead of pasting large snippets.

Structured AI meeting notes

将原始会议记录转换为结构化、可操作的笔记，保留决策日志、分配的行动项和关键上下文，以便未来 AI 检索使用。该技能弥合了会议讨论内容与 AI 代理在数天或数周后根据会议结果行动所需信息之间的鸿沟。

生产故障应急响应

从检测到解决的生产故障处理结构化流程——涵盖严重性评估、团队协调、沟通模板和事后分析要求。

Context-Aware QA Skill

Context-Aware QA is a prompting technique where an AI model is instructed to retrieve and cite authoritative sources before answering factual questions. By combining retrieval-augmented generation (RAG) with explicit verification instructions, it dramatically reduces hallucinations in production AI systems.

生产环境故障排查

调试与排障

在线上故障诊断的结构化方法，涵盖日志分类、指标峰值关联、发布窗口过滤和安全复现步骤。

安全升级依赖

维护

升级 npm/pip/Cargo 依赖的结构化检查清单，涵盖 changelog 分析、semver 风险评估、lockfile 处理和冒烟测试，确保不破坏生产环境。

RAG 管道构建

构建检索增强生成管道：嵌入分块策略、向量存储选择、混合搜索融合和重排序，使智能体能够基于您的文档回答而非产生幻觉式的通用响应。

多智能体交接设计

规划

设计专业智能体之间清晰的交接协议，使工作能够在规划者、编码者、审查者和执行者之间传递而不丢失上下文或产生循环依赖。

从代码生成文档

直接从代码中提取架构决策、API 契约和使用模式来生成准确的文档——保持文档与实现同步，而非将其视为单独的产物。

网站 SEO 审计

通过自动化爬取、Lighthouse 检查和结构化输出诊断整个网站的索引、可抓取性和页面 SEO 问题——在人工审核之前呈现带有优先级排序的可操作发现。

智能体工作流设计

规划

用明确的输入、输出、备选方案和交接协议来构建多步骤智能体任务，使智能体能可靠地完成复杂工作流，而不会在遇到第一个障碍时就停下。

代码库索引构建

构建并维护代码库的语义索引，使智能体能检索相关上下文——文件关系、符号使用、历史决策——而无需在每次查询时重新解析所有内容。

AI 产品需求文档撰写

写出能让 AI 智能体可靠执行的产品需求文档——对约束、边缘情况和验收标准都明确说明，最大限度减少你想要的和智能体实际构建之间的差距。

AI 生成代码的安全审查

审查 AI 生成的代码是否存在注入风险、凭证泄露、依赖漏洞和访问控制缺陷——捕捉智能体在优化功能而非安全性时容易遗漏的问题。

微调准备

为微调整理、清洗与格式化训练数据集：去重、质量过滤与输出格式化——让最终模型在你关心的行为上有真实提升。

评测与基准

构建评测套件：带基准答案的自动化评分与回归检测，让团队在模型或提示词变更上线前就知道效果有没有提升，而不是靠感觉。

多 Agent 编排

把多个专业 Agent 协调到同一任务：通过显式交接、冲突解决与结果汇总，让并行工作保持连贯而不是各自为战。

AI 成本优化

审计 Token 用量、模型选择、缓存策略与提示压缩，让团队在大规模 AI 功能下不失控——对高流量 Agent 流水线尤其关键。

提示词工程

用明确的上下文、角色定位、输出约束与引用要求来撰写提示词，让模型回复一致、可落地、可追溯到来源，适合需要进入流水线的 API 调用。

RAG 实现

构建检索增强生成流水线：文档分块、向量化、索引、排序与答案合成——让助手从自己的数据出发回答，而不是靠泛化训练知识。

可观测性基线

在让 Agent 接管发布前，先约定黄金信号、SLO 窗口与面板检查项——助手才知道何谓「健康」，而不是从嘈杂日志里猜。

事故复盘写作

在故障后沉淀时间线、影响面、促成因素与可跟踪的后续项，让团队从事故里学习，而不是重复同一种意外。

把库文档接进闭环

让助手对齐你真实在用的 README、changelog 与类型导出——借助 MCP 文档检索或粘贴片段——重构从真实签名出发，而不是靠「好像记得」的接口。

契约测试

用消费者驱动的契约把服务间 API 预期钉在 CI 里，重构先在流水线失败，而不是留到联调周末才爆。

金丝雀发布

先把一小部分流量打到新构建，看错误预算与延迟，再扩面或回滚；Agent 动发布链路时，意外也更可控。

结构化日志

约定少量日志字段（请求 ID、用户 ID、功能开关、延迟分桶），让线上排障不靠 grep 一堆格式不一的 printf。

威胁建模

上线前把数据流与信任边界走一遍：谁可以调什么、密钥从哪到哪、哪些故障会直接暴露给客户，让安全讨论从图开始，而不是截止前才掏清单。

安全重构

把重构拆成有测试兜底的小步：改名、抽取、搬迁，在改善结构的同时把行为钉死。

Humanizer（去 AI 腔）

依据维基「AI 写作迹象」等规则，削弱夸大重要性、堆砌 -ing、破折号滥用、机器人收尾语等问题，并在定稿前做「仍像 AI 吗」的二次审阅。

性能分析与剖析

结合链路追踪、火焰图与系统指标先定位真实瓶颈，再动代码，避免凭感觉做微优化却测不到收益。

中文去 AI 腔

清理中文稿里的翻译腔、口号式收尾、抽象词堆叠和僵硬 AI 节奏，同时保留有用事实，不把稿子改成空泛散文。

来源核验

在内容进入目录前，检查说法是否有一手来源、带日期的官方页面或可信二手来源支撑，避免把营销转述写成事实。

内容刷新

定期扫一遍旧工具、MCP、技能和资讯条目，处理过期价格、失效文档链接与弱摘要，不让目录慢慢变旧。

SEO 收录检查

发布内容批次前检查 sitemap、canonical、hreflang、robots 和 Search Console 信号，尤其适合现在这种双语静态站。

API 设计与版本策略

在实现固化之前，先定义 REST 或 RPC 的资源模型、错误形态、分页与弃用规则，避免客户端被不可控的破坏性变更拖垮。

发起代码评审

在主要改动完成后发起审查，突出风险面、测试覆盖与发布影响，帮评审者把精力放在刀刃上。

执行实施计划

按书面计划顺序推进，在检查点核对假设是否仍成立，适合 spec 驱动开发与多阶段重构。

撰写实施计划

在写代码之前，把已确认需求拆成带检查点、可验证交付物的分步实施计划，并标清会动到的文件与风险面。

Git 工作树隔离

用额外 worktree 承载并行实验或长任务，减轻主工作区 stash 堆积与上下文切换成本。

测试驱动开发（TDD）

用红绿重构循环把行为钉在测试上，适合新功能、回归缺陷和需要安全网的重构场景。

并行代理调度

把可并行的调研、文件批处理或模块实现拆给多个代理，并约定清晰的汇总与冲突解决责任人。

系统化调试

用假设—验证—最小复现替代拍脑袋，适合线上事故、构建抖动和难以复现的行为回归。

子代理驱动开发

在较大计划下由子代理分片执行，适合单线程太慢但仍需要单一集成与验收负责人的场景。

图像生成与编辑

设计

生成或编辑位图素材，用于封面、概念稿与快速视觉探索；交付物是栅格图而非纯代码矢量时优先使用。

收尾开发分支

在开发完成后统一处理验证、提交粒度、推送与分支生命周期，明确合并、压缩或后续工单。

插件脚手架

快速生成插件目录、清单与入口文件，让 Codex 或编辑器扩展从第一天起就结构清晰、便于评审。

动手前的头脑风暴

在写代码前澄清目标、约束与方案选项，避免在产品与交互决策上把自己逼进死角。

前端界面设计

设计

打造有辨识度且可落地的前端界面：版式节奏、字体层次、色彩与动效统一，避免「AI 味」模板感。

交付前验证

在宣称「完成」之前先跑测试、构建或约定的人工检查，让「完成」等于在真实环境里验证过。

OpenAI 文档检索

优先引用 OpenAI 官方文档与 API 参考，在集成模型与接口时减少二手博客带来的版本错误。

接收代码评审