Ejecuta el conjunto mínimo de verificaciones: pruebas, builds, verificaciones manuales o validaciones específicas del entorno que confirman que una tarea está verdaderamente completa antes de marcarla como hecha. Esta práctica previene el patrón común donde 'hecho' significa 'escrito' en lugar de 'funcionando en producción', y crea una definición compartida de completitud en el equipo.
Casos de uso
- Finalizando un ticket de funcionalidad que ha pasado revisión de código pero no ha sido smoke-tested en el entorno objetivo
- Completando una actualización de dependencia o cambio de configuración que podría comportarse diferente en staging versus localmente
- Entregando trabajo a un compañero y queriendo asegurar que los puntos de integración realmente funcionan
- Antes de merging un pull request que toca infraestructura o configuración de deployment
- Después de aplicar un hotfix directamente en producción y necesitando confirmar que el fix resolvió el incidente
Funciones principales
- Lista todos los comandos o acciones de verificación que probarían que la tarea funciona end-to-end en su entorno objetivo
- Ejecuta cada paso de verificación y captura el output actual, comparándolo con el output esperado en lugar de asumir éxito
- Inspecciona el output de logs y trazas de error para cualquier warning inesperado o comportamiento degradado incluso si la verificación principal pasa
- Marca la tarea completa solo después de que todos los pasos de verificación produzcan los resultados esperados, no solo el happy path
Relacionados
Relacionados
3 Entradas indexadas
Evaluation and benchmarking
Construye suites de evaluación con respuestas de ground truth, scoring automatizado y detección de regresión para que puedas medir si cambios de modelo o prompt realmente mejoran resultados antes de shippear. Sin evaluación sistemática, los equipos shippean cambios que parecen mejores anecdotamente pero pueden degradar casos edge específicos silenciosamente.
Finishing a development branch
Cierra sistemáticamente una rama de desarrollo ejecutando verificación, limpiando el historial de commits, haciendo push con tracking apropiado y haciendo una elección explícita entre merge, squash o tickets de seguimiento. Esto previene el patrón común de ramas abandonadas, PRs stale y contexto perdido cuando el trabajo no se concluye deliberadamente.
Observability baselines
Establece golden signals (latencia, tráfico, errores, saturación), ventanas de SLO y checks de dashboard antes de que los agentes automaticen deployments para que 'healthy' y 'degraded' tengan definiciones medibles en lugar de interpretaciones subjetivas. Esto es esencial cuando agentes de IA están manageando deploys porque los agentes necesitan métricas objetivas para tomar decisiones, no gut feelings de humanos.