FinOps no está roto porque no existan los datos — están en Cost Explorer y nadie los abre. Construimos un agente de IA con el que chateas en castellano: preguntale cuánto cuesta tu NAT Gateway, qué instancias EC2 están sobredimensionadas, o de dónde vino la anomalía del mes pasado.
Ocho microservicios en EKS, logs en CloudWatch sin trace IDs, y un MTTD de 45 minutos en cada incidente de pagos. Instrumentamos el stack completo con OpenTelemetry Collector, Grafana Tempo y auto-instrumentación — y encontramos una consulta N+1 que venía sumando 200ms a cada pago durante meses.
Construimos un agente SRE autónomo que se conecta a Datadog, Kubernetes, AWS y Cloudflare de forma simultánea — y le dimos acceso RAG a cada runbook, post-mortem y línea de código fuente que la empresa escribió. El MTTR bajó de 45 minutos a 8. Acá está la arquitectura.
Una startup DeFi en crecimiento nos contrató para endurecer su stack antes de una Serie A. Encontramos los patrones típicos de un equipo que priorizó el shipping sobre la seguridad — credenciales en CI, reglas de red permisivas, y algunos gaps específicos de blockchain. Acá están todos los hallazgos y todos los fixes.
En sitios de noticias, el tráfico llega en segundos y el Cluster Autoscaler reacciona en minutos. La única salida es pre-escalar antes del pico, usando el CMS editorial como señal. Así implementamos el patrón con webhooks, KEDA y Karpenter.
Reemplazamos Cluster Autoscaler con Karpenter, migramos el 80% de las cargas a Spot, e implementamos scale-to-zero para los servicios no críticos. La factura mensual pasó de $47K a $14K.
Construimos un agente de IA que lee logs, correlaciona trazas y sugiere fixes antes de que el ingeniero de guardia termine el café. Acá explicamos exactamente cómo lo hicimos.
Armamos un dashboard de visibilidad de costos en tiempo real con Grafana, Prometheus y exporters propios. Ahora cada equipo ve exactamente cuánto gasta — y empezaron a preocuparse por eso.
Un SaaS de salud gastaba $38K/mes en AWS sin saber adónde iba la plata. Auditamos todo, implementamos 12 cambios y lo bajamos a $18K. Acá está el desglose completo.