Skills

Convierte CNN (30-jun-2026) sobre levantamiento de controles de exportación a Fable 5/Mythos 5 en checklist política/seguridad. Hechos: Commerce levantó controles; Lutnick en X; Anthropic restaurará acceso; Fable=Mythos con guardrails; jailbreak Amazon; salvaguarda nueva; suspensión extranjeros; Mythos a entidades aprobadas; OpenAI GPT 5.6 limitado. Distinto del skill de imposición del ban.

Samsung ChatGPT Enterprise and Codex deployment due diligence

Convierte AI News (24-jun-2026) sobre Samsung ampliando ChatGPT Enterprise y Codex en checklist seguridad/compras. Hechos: empleados Korea + DX mundial; uso en dev/marketing/manufactura; restricción 2023 por filtración; controles enterprise; Codex 5M+ usuarios/semana, +800% WAU Corea desde 1-feb-2026; Kim: despliegue enterprise masivo; vínculos Stargate/SDS separados del rollout empleados.

OpenAI Jalapeño inference chip due diligence

Convierte Reuters vía Yahoo Tech (24-jun-2026) sobre chip Jalapeño OpenAI+Broadcom en checklist infra/finanzas/compras. Hechos: primer chip custom para inferencia; Tan: comparable a Blackwell/TPU; Ho: LLM actuales y futuras; despliegue fin-2026; Celestica servidores solo OpenAI; muestras lab con GPT-5.3-Codex-Spark; ~9 meses a TSMC con IA en diseño; márgenes presionados por HBM (SK Hynix/Samsung). Reuters: OpenAI explora chips desde 2023.

Anthropic–Alibaba distillation attack due diligence

Convierte CNBC 24-jun-2026 sobre carta de Anthropic al Senado Banking en checklist seguridad/legal/política. Hechos: Alibaba intentó extraer capacidades ilícitamente; carta 10-jun a Scott/Warren: mayor ataque de destilación conocido; 28,8M intercambios, ~25.000 cuentas fraudulentas (22-abr–5-jun); destilación entrena modelo pequeño con salidas de uno fuerte; Alibaba ignoró avisos OSTP; blog feb cita DeepSeek/Moonshot/MiniMax; contexto export-control Mythos/Fable. Alibaba sin respuesta inmediata; Bloomberg informó primero.

Five Eyes frontier AI cyber warning due diligence

Estructura CNN 23-jun-2026 sobre declaración conjunta Five Eyes en checklist seguridad/legal/ejecutivo. Five Eyes (EE. UU., Reino Unido, Canadá, Australia, NZ) advirtió que modelos frontera capaces de ciberataques mayores están a meses, no años; transformarán capacidades ofensivas/defensivas; líderes deben actuar ya: invertir, parchear, limitar acceso; IA defensiva detecta vulnerabilidades antes. Contexto CNN: tras orden Trump a Anthropic sobre extranjeros; sin marco regulatorio IA transparente en EE. UU.

SAP–Google agentic commerce architecture due diligence

Convierte AI News (19-jun-2026) sobre arquitectura agentic de comercio SAP + Google Cloud en checklist datos/retail/compras. Hechos: SAP 78% IA esencial retención 2026, <2/5 comparten datos CX/CRM; UCP en Commerce Cloud; Business Data Cloud Connect + BigQuery zero-copy bidireccional; Engagement Cloud multi-agente; Gemini/Nano Banana 2 y RCS; Shopping Assistant con inventario en vivo. Separa hechos verificados de decisiones internas.

ChatGPT Enterprise spend controls due diligence

Convierte el reporte Reuters vía Yahoo Tech (18-jun-2026) sobre analítica y controles de gasto de ChatGPT Enterprise en checklist finanzas/IT/compras. Consola admin global con créditos ChatGPT y Codex, desglose por usuario/producto/modelo, tendencias, top users, límite por defecto del workspace, límites por grupo y overrides individuales; empleados ven uso y piden créditos; disponible desde el jueves. Separa hechos verificados de políticas internas.

ChatGPT image-generation safety due diligence

Convierte BBC (17-jun-2026) sobre Mindgard red-teaming imágenes ChatGPT en checklist seguridad/legal. Hechos: prompt humorístico alterado; GPT-5.4 público generó contenido sexualizado/violento; alerta mayo con respuesta automática; OpenAI añadió salvaguardas tras BBC; Mindgard dice bypass persistía; Chowdhury: modelos sin comprensión de intent; UK AISI jailbreaks; DSIT: más trabajo pendiente.

Anthropic Mythos export-control directive due diligence

Estructura titulares de control de exportaciones de modelos frontera en checklist legal/seguridad. Cita CNN 13-jun-2026: Anthropic desactivó acceso tras orden de suspender extranjeros en Mythos 5/Fable 5; retiró acceso global; gobierno sin detalles específicos; Anthropic cita jailbreak estrecho de Fable 5; disputa estándar industrial; Axios: licencias Commerce; Fable 5 la semana pasada; EO 30 días; contexto supply-chain-risk.

Frontier model token price-war due diligence

Estructura titulares de precios de modelos frontera en checklist de finanzas/compras. Cita WSJ 11-jun-2026: OpenAI considera recortes drásticos en precio de tokens anticipando movimientos similares en Anthropic (fuentes); discusiones en flux; modelos de negocio bajo escrutinio antes de IPOs; OpenAI presentó IPO confidencial esa semana tras Anthropic; Altman en Slack planea salir a bolsa en el próximo año (Information). No confundir filtraciones con tarifas públicas.

EU AI Act Article 50 content labelling due diligence

Estructura titulares de transparencia generativa de la UE en checklist de cumplimiento. Cita AI News 16-jun-2026: Comisión publicó Código voluntario final el 10-jun antes de obligaciones Art. 50 desde 2-ago-2026; Código opcional, obligaciones no; deepfakes y texto IA de interés público deben llevar etiqueta; bots interactivos deben revelar máquina; Virkkunen sobre derecho a saber; proveedores marcan formato legible por máquina, desplegadores etiquetado visible sin revisión humana; estándares abiertos e icono UE; 6 expertos y >180 partes; faltan guías de la Comisión con <2 meses.

AI chipmaker debt capital raise due diligence

Estructura titulares de deuda de infraestructura IA en checklist de tesorería/IR. Cita CNBC 15-jun-2026: Nvidia presentó en SEC su primera venta de bonos investment-grade desde 2021; fuentes apuntan ≥20.000 M$ (quizá ~25.000 M$); acciones +3,5% el lunes y ~+14% YTD; contexto con Alphabet, Super Micro y Amazon; deuda ~7,5.000 M$ largo plazo y ~1.000 M$ corto; emisión 2021 de 5.000 M$; ingresos FY22 ~27.000 M$ vs FY26 216.000 M$; portavoz: fines generales incluyendo refinanciación; mayo: dividendo 0,25$, recompra 80.000 M$, ~50% FCF a accionistas, FCF trimestral 49.000 M$.

AI labor market JOLTS claims due diligence

Estructura titulares de IA y empleo en checklist de fuerza laboral. Cita CNN 2-jun-2026: vacantes EE. UU. a 7,62 millones en abril (máximo desde mediados de 2024) desde 6,89 millones en marzo; contrataciones y despidos bajan; renuncias voluntarias en mínimos de ~6 años; >90% del aumento en servicios profesionales; por primera vez desde jun-2025 más vacantes que buscadores; Noah Yosif (ASA) a CNN: datos empujan contra la narrativa de IA como «gran asesina de empleos»; CNN advierte volatilidad, revisiones y guerra Irán—sin usar un solo JOLTS como prueba de contratación junior por IA.

Regional AI assistant rollout due diligence

Estructura titulares de asistentes de plataforma en checklist legal/producto. Cita Yahoo Tech ~8-jun-2026 (WWDC): beta Siri AI basada en Gemini, integración conversacional; no en iPhone/iPad/Watch en la UE por DMA; sí en macOS 27 y visionOS 27; watchOS UE sin Siri AI por iPhone emparejado; Federighi sin cronograma iOS/iPadOS UE; retraso también en China; dispositivos soportados iPhone 17/16 y 15 Pro, iPad M4+, Mac M3+—sin asumir paridad global.

Mythos-class frontier model access due diligence

Estructura titulares de modelos Mythos-class en checklist de seguridad y compras: Fable 5 público vs Mythos 5 de acceso confiable. Cita BBC 10-jun-2026: Anthropic lanzó Claude Fable 5 (versión pública del Mythos previsualizado en abril); cita «Fable's capabilities exceed those of any model we've ever made generally available» y «releasing a model this capable comes with risks»; ~150 grupos de preview acceden a Mythos 5 con menos límites en ciber/biología; usuarios reportaron >10.000 fallas críticas; programa de acceso confiable más amplio; Jack Clark (Newsnight): la industria tiene acelerador pero no freno; valoración privada cerca de US$1 billón—sin tratar hype como contrato firmado.

Frontier AI lab IPO filing claims due diligence

Estructura titulares de IPO de labs de IA: S-1 confidencial vs retórica de valoración. Cita CNBC 8–9-jun-2026: OpenAI presentó S-1 confidencial ante la SEC; comunicado «We recently submitted a confidential S-1… We have not decided on timing yet»; valoración >US$850.000 millones; posible OPI en Q4 2026; Goldman y Morgan Stanley; oferta tender a US$852.000 millones post-money; ChatGPT >900 millones WAU; >US$180.000 millones recaudados y quema de caja; una semana tras filing de Anthropic a US$965.000 millones—sin usar valoraciones mediáticas como tesis.

Third-party GPU compute lease claims due diligence

Estructura titulares de arrendamiento GPU: tarifa mensual vs SLA de entrega y cláusulas de rescisión. Cita CNBC 5-jun-2026: Google pagará US$920 millones/mes a SpaceX oct-2026–jun-2029 por ~110.000 GPUs Nvidia; rampa hasta sep con tarifa reducida; rescisión si no entrega GPUs al 30-sep-2026; aviso 90 días tras 31-dic-2026; puente para Gemini Enterprise; tras fusión xAI US$1,25 billones y acuerdo Anthropic Colossus; capex Q1 SpaceX US$10.100 millones (US$7.700 millones IA)—sin usar cifras SEC como contrato propio.

Corporate AI token spend claims due diligence

Convierte titulares de gasto en tokens IA en checklist FinOps. Cita CNBC 4-jun-2026: Ramp US$750 millones a valoración US$44.000 millones (ICONIQ, GIC, Ontario Teachers; ~+38%), >US$1.000 millones ingresos anualizados y FCF positivo (Glyman), 70.000 empresas; tokens como tercer pilar; CFOs sin plan para crecimiento; clientes con mayor % ingresos en IA +12% vs planos en el mínimo; fin de tokenmaxxing—sin usar citas como presupuesto.

Custom AI semiconductor earnings claims due diligence

Estructura titulares de resultados de chips IA custom: ingresos/EPS vs segmento AI y software. Cita CNBC 3-jun-2026: Broadcom Q2 ingresos US$22.190 millones vs US$22.270 millones est., EPS ajustado US$2,44; AI semis US$10.800 millones (+143% interanual); guía Q3 ~US$29.400 millones; software infra US$7.180 millones vs US$7.320 millones; Tan reitera >US$100.000 millones AI en FY27 sin subir 2026; seis clientes core; solo chips—sin usar cifras como compromiso de compra.

Agentic AI orchestration efficiency claims due diligence

Convierte narrativas de eficiencia de IA agéntica en checklist: métricas citadas (p. ej. valor por vatio por usuario), lanzamientos y orquestación vs valuaciones mediáticas. Cita CNBC 3-jun-2026: Srinivas (Perplexity) dijo a Elaine Yu que ganará quien maximice «most taken value per watt per user» equilibrando precisión, latencia, costo, privacidad e inteligencia; Computer (feb) y Personal Computer en Windows; orquestación híbrida; valuación ~US$20.000 millones vs Anthropic ~US$1 billón y OpenAI ~US$850.000 millones; ingresos anualizados triplicados por mejoras de modelos Anthropic—sin usar eslóganes como benchmark interno.

Public equity AI infrastructure financing due diligence

Estructura titulares de financiación de infraestructura IA de emisores públicos: componentes de equity (OPV, ATM, private placement) vs guía de capex y deuda citada. Cita CNBC 1-jun-2026: Alphabet venderá US$80.000 millones en acciones (US$10.000 millones Berkshire) para cómputo IA; demanda supera oferta; capex 2026 US$180–190 mil millones; Pichai sobre capacidad de cómputo; CNBC cita capex combinado de hyperscalers >US$700.000 millones—sin usar totales mediáticos como presupuesto interno.

AI subscription monetization claims due diligence

Convierte anuncios de suscripciones de IA consumer en checklist: mercados piloto, precios, tier gratis, mix publicitario y capex vs proyecciones de analistas. Cita CNBC 30-may-2026: Meta AI US$7,99/US$19,99 en Singapur, Guatemala y Bolivia; ~98% ingresos Q1 de ads; capex IA US$125–145 mil millones; Wolfe estima ~US$3 mil millones 2027 a US$16 mil millones 2030—sin usar proyecciones como forecast interno.

Private AI funding and valuation claims due diligence

Estructura la verificación de rondas de financiación de IA privadas: valoración, tamaño, leads, compromisos previos y run-rate. Cita CNBC 28-may-2026: Anthropic Serie H US$65.000 millones a US$965.000 millones (Altimeter, Dragoneer, Greenoaks, Sequoia), US$15.000 millones previos con US$5.000 millones de Amazon, por encima de OpenAI US$852.000 millones; run-rate US$47.000 millones y lanzamientos Claude—sin usar cifras mediáticas como plan interno.

Hyperscaler cloud commitment due diligence review

Convierte compromisos cloud plurianuales y acuerdos en día de resultados en checklist FinOps: separa totales ($6B/5 años AWS) de gasto anual implícito, acuerdos previos y uso real en GPU IA vs Graviton. Cita CNBC 27-may-2026: compromiso Snowflake-AWS, Q1 $1.39B ingresos, EPS ajustado 39¢ y adquisición Natoma sin precio—sin tratar cifras mediáticas como órdenes de compra.

AI memory and HBM supply-chain claims due diligence

Estructura la verificación de afirmaciones públicas sobre escasez de memoria por IA, demanda HBM y valoraciones billonarias en un checklist: separa objetivos de analistas, rallies bursátiles y carga agentic de fuentes observables (LTAs, capacidad, precios). Cita CNBC: Micron superó US$1 billón el 26-may-2026 tras UBS de US$535 a US$1.625; SK Hynix el 27-may-2026 con ~250% YTD—sin respaldar ninguna recomendación.

Advanced chip roadmap claims due diligence review

Convierte anuncios públicos de semiconductores en lista de verificación cuando se alegan leyes de escalado, lógica apilada o equivalencia en nanómetros sin benchmarks independientes. Exige evidencia de rendimiento, térmica, empaquetado y validación externa —como en reportajes CNBC sobre LogicFolding/τ Scaling de Huawei y escepticismo analista sobre 1,4 nm sin EUV— y mapea controles de exportación e implicaciones para GPU.

AI economic benefit distribution readiness review

Convierte orientación de política pública y relaciones laborales sobre riqueza impulsada por IA en una lista para economías semiconductor-heavy: documentar si las ganancias llegan a bonos, dividendos públicos o reinversión; evaluar riesgo de concentración bursátil; preparar diálogo laboral recurrente. Cita reportajes CNBC sobre el viceprimer ministro surcoreano, huelga Samsung y rally Kospi liderado por fabricantes de chips.

Responsible AI accessibility data review

Convierte módulos de IA responsable de Microsoft Learn y patrones de remediación de accesibilidad en una lista para funciones generativas (imágenes, código, UI). Verifica brechas de datos (p. ej. estereotipos sobre personas ciegas), audita metadatos de datasets inclusivos, documenta correcciones con humanos en el bucle y alinea con el principio de que las personas siguen siendo responsables de los resultados de la IA.

Agentic coding vendor readiness review

Convierte guías de fiabilidad de plataforma y agentes de codificación multi-proveedor en una lista antes de estandarizar un stack de IA para código: inventariar SLAs del host SCM (incidentes en githubstatus.com), comparar agentes primarios/reserva (Copilot, Cursor, Claude Code, Codex), verificar observabilidad con Braintrust u otras trazas, y ensayar flujos cuando el host o la API del agente fallen. Cita páginas de estado y cambios de facturación públicos (p. ej. Copilot por uso en github.blog).

Multi-region LLM provider readiness review

Convierte guías de control de exportación y enrutamiento multi-proveedor en una lista de planificación cuando un solo país o proveedor de chips no puede asumirse disponible. Se documentan rutas primarias y de contingencia (p. ej. Helicone o LiteLLM Router), se cuantifica exposición de ingresos/latencia si una región queda bloqueada y se alinea mensaje a inversores cuando el liderazgo pide «no esperar nada» de un mercado—como en reportajes sobre licencias de chips en China. Incluye sign-off legal, simulacros de failover y evidencia antes de lanzamientos sensibles geopolíticamente.

LiteLLM Router fallback readiness review

Convierte la documentación de enrutamiento de LiteLLM en una lista de verificación previa al paso a producción de rutas multi-despliegue: confirmar listas primarias/fallback, reintentos y balanceo según docs.litellm.ai/docs/routing, validar claves virtuales y límites de gasto si el tráfico pasa por LiteLLM Proxy, y ensayar caídas de proveedor observando excepciones mapeadas a OpenAI. Incluye activar `store_model_in_db` cuando persistan MCP y verificar nombres de servidor MCP conformes a SEP-986 citados desde LiteLLM v1.80.18.

LangSmith production trace investigation playbook

Depuración

Convierte la documentación de observabilidad de LangSmith en un flujo repetible para incidentes de LLM y agentes: partir de un run o thread fallido, usar la UI o herramientas MCP (`fetch_runs`, `get_thread_history`) para reconstruir prompts, llamadas a herramientas y errores, y acotar con filtros documentados (run_type, is_root, FQL filter/trace_filter/tree_filter) antes de cambiar código o prompts. Recuerda la paginación por presupuesto de caracteres (`page_number`, `total_pages`) y separar MCP remoto OAuth de Cloud frente a `LANGSMITH_ENDPOINT` self-hosted al recopilar evidencias.

OWASP GenAI LLM Top 10 (v1.1) threat review checklist

Alinea la taxonomía oficial OWASP Top 10 for Large Language Model Applications (v1.1), de LLM01 Prompt Injection hasta LLM10 Model Theft, con un checklist ejecutable para arquitectos que revisan RAG, agentes, complementos y pipelines citando genai.owasp.org. Cada entrada resume el riesgo descrito públicamente por OWASP—incluyendo manipulación de prompts, manejo inseguro de salidas, envenenamiento del entrenamiento, abuso de cómpute, cadena suministro, filtraciones sensibles, plugins con privilegio excesivo, agencias no acotadas, dependencia irracional frente al modelo y robo del weights—emparejándola controles concretos de políticas, supervisión y hardening toolchain.

Postmortem trigger and root-cause taxonomy

Resume el Apéndice C del workbook SRE (“Results of Postmortem Analysis”): explica cómo Google estandariza postmortems para relacionar disparadores observables versus categorías de causa raíz, priorizando arreglos sistémicos. El apéndice cita estadística histórica 2010–2017 donde empujes binarios (~37 %) y configuración (~31 %) encabezan triggers, más fracciones menores comportamiento usuarios (~9 %), pipelines (~6 %), cambios proveedor (~5 %), degradación (~5 %), capacidad (~5 %) y hardware (~2 %). Otra tabla liga causa raíz: fallos software (~41 %), proceso desarrollo (~20 %), comportamientos complejos (~17 %), planificación despliegue (~7 %), red (~3 %). Úsalas como benchmark heurístico, no SLA.

Example SLO document authoring

Operacionaliza el Apéndice A del libro de trabajo de Google SRE reinterpretando la carpeta ficticia del “Example Game Service” como checklist ejecutable: redactar el trabajo visible para usuarios; fijar ventanas móviles (ej. cuatro semanas); emparejar subsistemas con SLIs bien definidas (disponibilidad excluyendo 5xx, latencias con cortes ms, freshness de tablas derivadas, corrección vía probes, cobertura de pipelines); exponer texto num/denom; fundamentar redondeos; derivar presupuestos de error objetivo‑a‑objetivo y enlazar la política de presupuesto de errores correlativa.

Error budget policy drafting

Adapta el ejemplo de política de presupuesto de errores del workbook de Google en una guía repetible para ligar el ritmo de releases a la fiabilidad medida: define objetivos (proteger a usuarios de fallos repetidos de SLO preservando incentivos de innovación), detalla qué ocurre cuando la ventana móvil agota el presupuesto (congelar cambios salvo defectos urgentes o trabajo de seguridad), codifica umbrales de investigación por outage y documenta escalamiento cuando hay desacuerdo sobre el cálculo del presupuesto.

NIST AI Risk Management Framework (AI RMF 1.0) lifecycle checklist

Planificación

Fija talleres ejecutivos sobre el Artificial Intelligence Risk Management Framework (AI RMF 1.0) de NIST, publicado oficialmente como NIST.AI.100-1 (DOI https://doi.org/10.6028/NIST.AI.100-1) y apoyado en el Playbook y recursos del AI Resource Center. El texto oficial organiza trabajo en torno al ciclo GOVERN → MAP → MEASURE → MANAGE antes de lanzar iniciativas desconectadas. Para cargas fundacionales o generativas debe consultarse también el perfil voluntario sobre IA Generativa (NIST AI 600-1, 2024-07-26; DOI https://doi.org/10.6028/NIST.AI.600-1). La skill sintetiza esos contenidos públicos como preguntas de responsabilidad, evidencias y planes de reinspección, sin declararse asesoría legal.

Creating and maintaining Cursor skills

Define cómo redactar, revisar y validar archivos SKILL.md para que las skills de agente sean ejecutables, acotadas y verificables. El foco es convertir conocimiento tácito en instrucciones operativas reutilizables con disparadores claros, pasos deterministas y controles de verificación.

Designing with LLM structured outputs

Define esquemas, activa el modo de salida estructurada que documente tu proveedor, valida siempre en servidor y trata los rechazos como eventos de primera clase—fundamental cuando los regex sobre texto libre son demasiado frágiles en producción.

Maintaining Cursor Project Rules

Las Project Rules de Cursor son archivos Markdown o `.mdc` dentro de `.cursor/rules`, versionados en git e inyectados en el Agent según frontmatter (`description`, `globs`, `alwaysApply`). Sirven para arquitectura, zonas delicadas o plantillas repetibles; Cursor documenta cuatro tipos de aplicación más AGENTS.md como alternativa ligera.

Structured AI meeting notes

Convierte transcripciones de reuniones en notas estructuradas y accionables con registro de decisiones, tareas asignadas y contexto clave preservado para recuperacin futura por IA.

Incident response

Proceso estructurado para manejar incidentes de producción desde detección hasta resolución y post-mortem. Cubre evaluación de severidad usando gradación P0-P3, coordinación de equipo con un incident commander designado, plantillas de comunicación para interesados y usuarios, y requisitos de post-mortem estructurados para impulsar aprendizaje organizacional de cada outage significativo.

Habilidad de QA Consciente del Contexto

QA Consciente del Contexto es una técnica de prompting en la que se instruye a un modelo de IA a recuperar y citar fuentes autoritativas antes de responder preguntas factuales. Al combinar generación aumentada por recuperación (RAG) con instrucciones de verificación explícitas, reduce drásticamente las alucinaciones en sistemas de IA en producción.

Production debugging

Depuración

Diagnostica incidentes de producción live usando triage de logs, correlación de spikes de métricas, filtering de ventana de deployment y pasos de reproducción seguros sin causar mayor disrupción. Production debugging aplica principios de depuración sistemática en un entorno live donde el costo de acciones wrongas es alto y la habilidad de reproducir el issue es limitada.

Safe dependency upgrades

Mantenimiento

Una checklist estructurada para actualizar dependencies de npm, pip, Cargo o similares sin romper producción. Esto cubre análisis de changelog, evaluación de riesgo semver, manejo de lockfile y smoke testing para que updates rutinarios de dependencias no se conviertan en fuentes de incidentes de producción.

RAG pipeline construction

Construye pipelines de retrieval-augmented generation production-ready con estrategias de chunking deliberadas, selección de modelo de embedding, configuración de vector store, blending de búsqueda híbrida y reranking para que los agentes respondan desde tus documentos con alucinación reducida y fuentes citadas. Esta habilidad se enfoca en las decisiones de ingeniería que separan un prototype que funciona de un sistema RAG de calidad de producción.

Multi-agent handoff design

Planificación

Diseña protocolos de handoff limpios entre agentes especializados para que el trabajo pase entre planner, coder, reviewer y executor sin perder contexto, creando dependencias circulares o introduciendo race conditions. Handoff design trata la comunicación agente-a-agente como un contrato de API con versionamiento, manejo de errores y requisitos de acknowledgment explícitos.

Documentation from code

Extrae decisiones arquitectónicas, contratos de API y patrones de uso directamente del código para producir documentación precisa que se mantiene en sync con la implementación. Documentation-from-code trata el código como la fuente de verdad y genera prosa desde él en lugar de mantener documentación como un artefacto separado que diverge con el tiempo.

SEO audit for web properties

Diagnostica issues de indexing, crawlability y SEO on-page a través de un sitio completo usando crawls automatizados, checks de Lighthouse y output estructurado. Una auditoría SEO surfacea findings accionables rankeados por prioridad antes de la revisión manual, haciendo posible abordar issues críticos rápidamente en lugar de descubrirlos a través de drops de tráfico.

Agentic workflow design

Planificación

Estructura tareas de agente multi-step con inputs explícitos, outputs, comportamiento de fallback y protocolos de handoff para que los agentes completen workflows complejos fiablemente en lugar de detenerse en el primer blocker. Agentic workflow design aplica disciplina de ingeniería de software a pipelines de agente de IA, tratando cada paso como una función con inputs y outputs tipados.

Codebase indexing

Construye y mantiene índices semánticos de un codebase para que asistentes de codificación de IA puedan retrieve contexto relevante: relaciones de archivos, uso de símbolos, decisiones históricas sin re-parsear el codebase completo en cada query. Codebase indexing es esencial para codebases grandes donde límites de context window previenen alimentar el codebase completo al modelo.

AI product requirement writing

Escribe documentos de requisitos de producto que agentes de IA pueden actuar fiablemente, con restricciones explícitas, casos edge y criterios de aceptación que minimizan la brecha entre lo que quieres y lo que el agente construye. Esta habilidad cierra la ambigüedad de specs de producto en lenguaje natural y la precisión que los agentes de IA requieren para producir resultados consistentes.

Security review for AI-generated code

Revisa código generado por IA por modos de fallo de seguridad que asistentes de IA comúnmente pasan por alto: riesgos de prompt injection, exposición de credenciales, vulnerabilidades de dependencias, deserialización insegura y gaps de control de acceso. Esta habilidad detecta lo que los agentes pierden cuando optimizan por funcionalidad sobre seguridad, especialmente en código que maneja input de usuario, autenticación o datos externos.

Fine-tuning preparation

Curate, deduplica y formatea datasets de training para fine-tuning para que el modelo resultante realmente mejore en comportamientos objetivo en lugar de aprender ruido. Fine-tuning preparation cubre filtrado de calidad de dataset, consistencia de formato de output, splits de train/test y evitar common pitfalls como data leakage que invalidan resultados de fine-tuning.

Evaluation and benchmarking

Construye suites de evaluación con respuestas de ground truth, scoring automatizado y detección de regresión para que puedas medir si cambios de modelo o prompt realmente mejoran resultados antes de shippear. Sin evaluación sistemática, los equipos shippean cambios que parecen mejores anecdotamente pero pueden degradar casos edge específicos silenciosamente.

Multi-agent orchestration

Coordina múltiples agentes de IA en tareas compartidas con protocolos de handoff explícitos, gestión de estado compartido y resolución de conflictos para que el trabajo paralelo se mantenga coherente. Multi-agent orchestration es más estructurado que simple dispatch paralelo porque los agentes asumen roles distintos con dependencias explícitas en lugar de ejecutar briefs idénticos en datos independientes.

AI cost optimization

Audita uso de tokens, selección de modelos, estrategia de caching y compresión de prompts para prevenir costos de inferencia descontrolados a medida que las funcionalidades de IA escalan. Esto es especialmente importante para workflows agentic de alto volumen donde llamadas repetidas se compounding rápidamente y donde la brecha entre una implementación bien optimizada y una descuidada puede ser de órdenes de magnitud en costo.

Prompt engineering

Craftea prompts con framing de tarea explícito, definición de rol, restricciones de output, requisitos de citación y few-shot examples para que las respuestas del modelo sean consistentes, fundamentadas en evidencia y accionables para tareas downstream. Prompt engineering reduce la variabilidad y riesgo de alucinación que viene de prompts sub-especificados.

RAG implementation

Construye pipelines de retrieval-augmented generation que fundamentan las respuestas del modelo en tus propios documentos en lugar de conocimiento genérico de training. Una implementación de RAG cubre ingestión de documentos, chunking semántico, embedding, almacenamiento vectorial, búsqueda híbrida, reranking y síntesis de respuesta: para que los asistentes respondan desde tus datos con fuentes citadas.

Observability baselines

Establece golden signals (latencia, tráfico, errores, saturación), ventanas de SLO y checks de dashboard antes de que los agentes automaticen deployments para que 'healthy' y 'degraded' tengan definiciones medibles en lugar de interpretaciones subjetivas. Esto es esencial cuando agentes de IA están manageando deploys porque los agentes necesitan métricas objetivas para tomar decisiones, no gut feelings de humanos.

Postmortem writing

Captura la línea de tiempo completa del incidente, blast radius, factores contribuyentes y acciones de seguimiento concretas después de incidentes de producción para que los equipos construyan memoria institucional en lugar de repetir las mismas sorpresas. Un postmortem bien escrito separa causa raíz de triggers, evita culpa y produce action items rastreados que previenen recurrencia.

Library docs in the loop

Mantiene las respuestas de asistentes de IA ancladas a la documentación real de la librería, changelog y firmas tipadas que se shippean en lugar de a memoria o resúmenes de blogs stale. Esto es esencial durante bumps de versión mayores, integración de SDKs unfamiliar o hotfixes de on-call donde guesses confiados pero incorrectos sobre comportamiento de API causan más daño que el bug original.

Contract testing

Bloquea expectativas de API entre servicios usando consumer-driven contracts para que cuando un equipo cambia su implementación, falla en CI en lugar de durante un deployment de producción Coordinado. Contract testing previene el patrón común de fallo de integración donde ambos lados de una API parecen trabajar en aislamiento pero rompen cuando se conectan en producción.

Canary rollouts

Despliega una nueva versión a un pequeño porcentaje de tráfico de producción primero, monitorea error budgets y latencia contra línea base y automáticamente amplía o hace rollback basado en criterios pre-definidos. Esto mantiene el blast radius de un mal deployment pequeño: particularmente importante cuando agentes de IA están modificando pipelines de deployment donde un solo mal comando podría afectar a muchos usuarios.

Structured logging

Define un conjunto consistente de campos de log: request ID, user ID, feature flag, latency bucket, error code para que debugging de producción no dependa de grep a través de strings inconsistentes estilo printf. Structured JSON o key=value logging habilita dashboards, alerts y herramientas de agregación de logs para parsear y consultar logs programáticamente en lugar de a través de búsqueda manual de texto.

Threat modeling

Identifica sistemáticamente amenazas a un sistema mapeando flujos de datos, definiendo trust boundaries y enumerando adversarios y misuse cases antes de shippear. Esto produce un diagrama enfocado en seguridad y lista de mitigaciones priorizada que hace las revisiones de seguridad subsecuentes más rápidas y sustantivas que partir de un checklist genérico.

Safe refactoring

Ejecuta cambios de refactoring en pasos pequeños y respaldados por pruebas para que el comportamiento se preserve mientras la estructura mejora. Cada operación de refactoring: rename, extract, inline, move es validada por la suite de pruebas antes de proceder a la siguiente, previniendo el patrón común de refactoring en regresiones comportamentales sutiles que solo se detectan en producción.

Humanizer

Elimina los patrones comunes de escritura generada por IA: inflación de significancia, construcciones filler -ing, cadenas de em-dash y cierres formulaicos que hacen que la prosa generada por máquina se sienta genérica o sobreproducida. Ejecuta un paso final de auditoría '¿todavía es obviamente IA?' antes de enviar cualquier prosa destinada a lectores humanos.

Performance profiling

Encuentra cuellos de botella de rendimiento genuinos usando perfiles de CPU, flame graphs, trazas de memoria y métricas de sistema bajo carga realista antes de reescribir código. Esto previene el anti-patrón común de gastar días optimizando paths de código que no están en el critical path, basados en intuición en lugar de medición.

Chinese Humanizer

Aprieta drafts chinos removiendo translationese, finales de slogan, abstracciones apiladas y ritmo de IA rígido mientras preserva precisión factual. Esto aborda los modos de fallo específicos de texto chino machine-translated o AI-generated: estructuras palabra-por-palabra de inglés, patrones retóricos occidentales que se sienten naturales para lectores chinos, y frases filler que añaden longitud sin significado.

Source verification

Verifica si un reclamo está respaldado por una fuente primaria, una página oficial actual o una fuente secundaria reputable antes de que ese reclamo se convierta en copy publicada. Esta habilidad es esencial para directorios de herramientas de IA, listings de servidores MCP y resúmenes de noticias donde precisión y confiabilidad directamente afectan las decisiones de los lectores y credibilidad SEO.

Content refresh

Ejecuta una auditoría programada de entries existentes de herramientas, MCP, skills y noticias para identificar y abordar precios stale, links de documentación rotos, capacidades desactualizadas y prosa debilitada que silenciosamente degrada la calidad del directorio. Este ritmo de mantenimiento previene que el directorio acumule digital rot a medida que las herramientas evolucionan y los entries se vuelven desactualizados.

SEO indexing check

Revisa completitud del sitemap, configuración de canonical URL, emparejamiento hreflang para sitios bilingües, directivas de robots.txt y señales de Search Console antes de publicar un batch de contenido. Esto es especialmente importante para sitios estáticos bilingües donde configuraciones incorrectas de indexing pueden causar que los motores de búsqueda indexen el locale equivocado o deprioricen páginas injustamente.

API design and versioning

Da forma a superficies de API REST o RPC con modelado consistente de recursos, respuestas de error predecibles, endpoints de lista paginados y una política de deprecación explícita antes de que la implementación te encasille en contratos costosos de cambiar. Un buen diseño de API previene breakage de clientes, reduce carga de soporte y hace las adiciones de funcionalidades menos disruptivas.

Requesting code review

Enmarca un pull request para que los revisores entiendan el perfil de riesgo, qué ha sido probado y dónde enfocar su atención limitada. Esto produce revisiones más rápidas y útiles porque los revisores pasan menos tiempo reconstruyendo contexto y más tiempo evaluando los cambios reales.

Executing implementation plans

Ejecuta un plan de implementación pre-escrito en orden disciplinado, deteniéndose en puntos de control definidos para verificar supuestos antes de avanzar. Esta habilidad previene el patrón común de desviarse del plan silenciosamente cuando la realidad prueba que está equivocado, y crea oportunidades naturales de corregir el rumbo antes de que errores pequeños se compounding en rework grande.

Writing implementation plans

Convierte requisitos vagos o estancados en planes de implementación precisos con pasos definidos, puntos de contacto por archivo, puntos de control de decisión y criterios de aceptación verificables antes de escribir cualquier código. Esto cierra la brecha entre lo que los interesados quieren y lo que los ingenieros realmente pueden entregar, reduciendo sorpresas a mitad de sprint y refactorizaciones desperdiciadas.

Git worktrees for isolation

Usa Git worktrees para crear directorios de trabajo aislados conectados al mismo repositorio, cada uno en una rama diferente, para que experimentos paralelos o tareas de larga ejecución no interfieran con el main working tree o requieran ciclos repetitivos de stash-and-reapply. Esto es especialmente útil cuando una rama requiere un build o test run pesado mientras el trabajo continúa en otra.

Test-driven development

Impulsa el desarrollo mediante ciclos red-green-refactor donde escribes una prueba fallida que nombra el comportamiento deseado antes de escribir cualquier código de implementación. TDD produce pruebas que documentan la intención, detectan regresiones inmediatamente y fuerzan incrementos pequeños y verificables, haciéndolo especialmente valioso para funcionalidades complejas, correcciones de bugs con casos de fallo conocidos, y cualquier código que necesite una red de seguridad a largo plazo.

Dispatching parallel agents

Distribuye trabajo vergonzosamente paralelo a través de múltiples agentes de IA con briefs claros y protocolos de handoff nítidos, luego agrega sus resultados a través de un único integrador. Esta técnica maximiza el throughput cuando las tareas son independientes y el overhead de coordinación es bajo, haciéndola ideal para chunks de investigación, batches de archivos o procesamiento de datos en paralelo.

Systematic debugging

Reemplaza la depuración de prueba-y-error con un proceso basado en hipótesis: formula una hipótesis refutable, construye la reproducción más pequeña posible y verifica la evidencia antes de tocar el código. Este enfoque estructurado es más valioso durante incidentes de producción, builds de CI inestables y regresiones confusas donde la depuración intuitiva desperdicia horas en síntomas correlacionados pero no causales.

Subagent-driven development

Coordina múltiples subagentes de IA en slices de un plan más grande donde cada subagente maneja un alcance definido mientras un único agente padre retiene responsabilidad por integración, calidad y entrega final. Este enfoque es valioso cuando un único agente trabajando secuencialmente sería demasiado lento, pero aún necesitas calidad coherente end-to-end en lugar de outputs fragmentados.

Image generation

Diseño

Crea o edita arte bitmap para portadas, mockups conceptuales y exploración visual rápida cuando el entregable requiere calidad fotográfica, texturas complejas o estilos artísticos que son imprácticos de codear a mano en SVG o CSS. La generación de imágenes acelera la fase inicial de diseño produciendo referencias visuales concretas antes de comprometerse con un estilo final.

Finishing a development branch

Cierra sistemáticamente una rama de desarrollo ejecutando verificación, limpiando el historial de commits, haciendo push con tracking apropiado y haciendo una elección explícita entre merge, squash o tickets de seguimiento. Esto previene el patrón común de ramas abandonadas, PRs stale y contexto perdido cuando el trabajo no se concluye deliberadamente.

Plugin scaffolding

Bootstrap un estructura de proyecto de plugin completa con archivos de manifiesto, puntos de entrada, esquemas de configuración y pruebas base para que las nuevas extensiones de Codex o editor sigan una plantilla consistente y revisable desde el día uno. Esto elimina el costo de setup para crear nuevos plugins y asegura que cada plugin en un codebase comparta las mismas convenciones para configuración, logging y manejo de errores.

Brainstorming before build

Explora objetivos, restricciones, riesgos y opciones de diseño antes de comprometerse con un camino de implementación específico. Esta técnica es más valiosa cuando se enfrentan decisiones de producto o UX donde la elección equivocada es costosa de revertir: nuevas funcionalidades con valor de usuario incierto, pivotes arquitectónicos o dependencias cruzadas donde cada equipo tiene un modelo mental diferente del problema.

Frontend design

Diseño

Crea layouts de UI y componentes de grado de producción con espaciado deliberado, jerarquía tipográfica, aplicación de color y diseño de movimiento para que la interfaz comunique estructura y estado claramente. Esta habilidad se aplica cuando se construyen nuevas secciones de UI, se-rediseñan páginas existentes o se establecen patrones de componentes que necesitan sentirse intencionales y cohesivos en lugar de defaults de una librería de componentes.

Verify before you ship

Ejecuta el conjunto mínimo de verificaciones: pruebas, builds, verificaciones manuales o validaciones específicas del entorno que confirman que una tarea está verdaderamente completa antes de marcarla como hecha. Esta práctica previene el patrón común donde 'hecho' significa 'escrito' en lugar de 'funcionando en producción', y crea una definición compartida de completitud en el equipo.

OpenAI documentation lookup

Prioriza la documentación oficial de OpenAI, model cards y referencias de API cuando investigas detalles de integración, capacidades de modelos o cambios de comportamiento de API. Esto evita el ruido y la staleness de posts de blogs de terceros que pueden resumir versiones de modelos más antiguas o información incompleta.

Receiving code review