Volver a guíasGuía

Construir timelines de incidentes con logs, métricas y trazas sin inventarte la película

Un flujo práctico para reconstruir incidentes cuando el dashboard va por un lado, los logs por otro y el on-call ya no se fía de nadie.

Las señales recientes del ecosistema apuntan a lo mismo: más telemetría no garantiza mejores diagnósticos. Esta guía aterriza un método reproducible para construir timelines fiables con Prometheus, Loki y OpenTelemetry, evitando errores muy actuales como métricas de memoria mal interpretadas, labels ruidosos y trazas sin suficiente contexto de petición.

Creada: 19 de abril de 2026

Publicada: 19 de abril de 2026

Tiempo estimado42 min
NivelIntermedio
Antes de empezarAcceso de lectura a Prometheus, Loki y tu backend de trazas
PlataformasLinux / Docker
WhatsAppXLinkedIn

Docker

Úsalo en un laboratorio o stack autocontenido con Docker Compose para repetir el análisis sin depender de tu shell del host.

docker composeContenedores prometheus, loki y tempo o equivalentes levantadosPermisos para ejecutar consultas internas
Lanzar la consulta de errores desde el contenedor de Prometheus
docker compose exec prometheus wget -qO- 'http://localhost:9090/api/v1/query?query=sum(rate(http_server_requests_seconds_count%7Bservice%3D%22checkout%22%2Cstatus%3D~%225..%22%7D%5B5m%5D))'
Consultar Loki desde el stack local
docker compose exec loki wget -qO- 'http://localhost:3100/loki/api/v1/query?query=%7Bservice_name%3D%22checkout%22%7D%20%7C%3D%20%22timeout%22'
Buscar trazas lentas desde Tempo en Docker
docker compose exec tempo wget -qO- 'http://localhost:3200/api/search?q=%7B%20resource.service.name%20%3D%20%22checkout%22%20%26%26%20span.http.status_code%20%3E%3D%20500%20%7D'

Contenido bloqueado

Esta guía requiere completar ambos pasos para leer el contenido completo.

  • Dale a “Me gusta” en la guía.
  • Comparte en WhatsApp, X, LinkedIn o copia el enlace.

Cuando se cumplan ambos pasos, el acceso se desbloquea automáticamente.