SRE
Todos los posts con el tag sre
$ cd /blog/
2026-04-11
|
18 min read
Ocho microservicios en EKS, logs en CloudWatch sin trace IDs, y un MTTD de 45 minutos en cada incidente de pagos. Instrumentamos el stack completo con OpenTelemetry Collector, Grafana Tempo y auto-instrumentación — y encontramos una consulta N+1 que venía sumando 200ms a cada pago durante meses.
2026-04-10
|
15 min read
Construimos un agente SRE autónomo que se conecta a Datadog, Kubernetes, AWS y Cloudflare de forma simultánea — y le dimos acceso RAG a cada runbook, post-mortem y línea de código fuente que la empresa escribió. El MTTR bajó de 45 minutos a 8. Acá está la arquitectura.
2026-03-28
|
6 min read
Construimos un agente de IA que lee logs, correlaciona trazas y sugiere fixes antes de que el ingeniero de guardia termine el café. Acá explicamos exactamente cómo lo hicimos.