Todas las guías

Filtra por categoría, dificultad o texto libre para encontrar el material que encaja con tu equipo.

Logs~40 min

Depurar pipelines de Vector antes de que retries y buffers tapen el cuello real

Creada: 1 de mayo de 2026 · Publicada: 1 de mayo de 2026

Una guía práctica para usar métricas internas de Vector, validación de configuración y pruebas de aislamiento cuando los logs llegan tarde, se reintentan demasiado o desaparecen.

LinuxDocker
Intermedio
Leer guía
Metrics~40 min

Reducir picos de cardinalidad en Prometheus sin dejar ciegas tus alertas

Creada: 30 de abril de 2026 · Publicada: 30 de abril de 2026

Una guía práctica para detectar cuándo Prometheus se infla por labels inestables, recortar la cardinalidad en el sitio correcto y validar que las alertas siguen cubriendo el incidente real.

LinuxDocker
Avanzado
Leer guía
Logs~40 min

Arreglar la explosión de labels en Loki sin romper las búsquedas que sí importan

Creada: 29 de abril de 2026 · Publicada: 29 de abril de 2026

Una guía práctica para identificar labels de alta cardinalidad en Loki, sacarlas de la ruta crítica y validar que las búsquedas sigan siendo útiles.

LinuxDocker
Avanzado
Leer guía
Logs~40 min

Diagnosticar hot shards en OpenSearch antes de que se disparen la latencia y las colas de indexación

Creada: 27 de abril de 2026 · Publicada: 27 de abril de 2026

Aprende a confirmar un hot shard en OpenSearch, localizar el índice y nodo problemáticos, corregir la causa y validar que la recuperación es real.

LinuxDocker
Avanzado
Leer guía
Metrics~40 min

Entender las métricas de memoria de Kubernetes sin disparar falsas alertas de OOM

Creada: 26 de abril de 2026 · Publicada: 26 de abril de 2026

Guía práctica para diagnosticar memoria de contenedores en Kubernetes con Prometheus y Grafana sin confundir usage, working set, RSS ni page cache recuperable.

LinuxDocker
Intermedio
Leer guía
OpenTelemetry~35 min

Diagnosticar backpressure en OpenTelemetry Collector antes de perder señales

Creada: 25 de abril de 2026 · Publicada: 25 de abril de 2026

Una guía de troubleshooting avanzada para aislar si el atasco está en el exporter, la red, el backend o el propio Collector antes de empezar a perder telemetría.

DockerLinux
Avanzado
Leer guía
Metrics~38 min

Limpiar ruido de kube-state-metrics para que tus dashboards vuelvan a decir algo

Creada: 20 de abril de 2026 · Publicada: 20 de abril de 2026

kube-state-metrics sigue siendo útil, pero en 2026 llega con más superficie, más métricas estables y cambios recientes como EndpointSlices por defecto. Si tus paneles se llenaron de series irrelevantes, joins frágiles o estados duplicados, esta guía te enseña a reducir ruido en la fuente, corregir consultas y validar que el recorte no rompe alertas ni troubleshooting.

LinuxDocker
Intermedio
Leer guía
Logs~55 min

Resolver hot shards en OpenSearch antes de que el clúster empiece a arder

Creada: 19 de abril de 2026 · Publicada: 19 de abril de 2026

Guía avanzada para aislar hot shards en OpenSearch con señales de nodo, shard e ingesta, y aplicar mitigaciones reversibles antes de que aparezcan colas, timeouts y backlogs.

LinuxDocker
Avanzado
Leer guía
Logs~24 min

Depurar pipelines de Vector cuando los logs llegan tarde, mal o nunca

Creada: 17 de abril de 2026 · Publicada: 17 de abril de 2026

Cuando un pipeline de Vector empieza a retrasar, duplicar o perder eventos, el problema casi nunca se resuelve tocando parámetros al azar. Esta guía muestra cómo usar métricas internas, validación de configuración y señales del sink para encontrar el cuello real y corregirlo con cambios reversibles.

DockerLinux
Intermedio
Leer guía
Logs~60 min

Qué hacer cuando Loki se hunde por labels con demasiada cardinalidad

Creada: 13 de abril de 2026 · Publicada: 13 de abril de 2026

Guía práctica para detectar y arreglar problemas de alta cardinalidad en labels que degradan o bloquean Loki: síntomas operativos, métricas y logs a revisar, cambios seguros en Promtail/ingest pipelines y comprobaciones de validación.

DockerLinux
Avanzado
Leer guía
Metrics~60 min

Reducir picos de cardinalidad en Prometheus sin romper alertas

Creada: 11 de abril de 2026 · Publicada: 11 de abril de 2026

Guía práctica para detectar fuentes de cardinalidad alta, aplicar relabeling y rollups seguros, y validar que las alertas críticas siguen siendo efectivas.

DockerLinux
Avanzado
Leer guía
OpenTelemetry~35 min

Diagnosticar backpressure en OpenTelemetry Collector antes de perder señales

Creada: 10 de abril de 2026 · Publicada: 10 de abril de 2026

Una guía de troubleshooting avanzada para aislar si el atasco está en el exporter, la red, el backend o el propio Collector antes de empezar a perder telemetría.

DockerLinux
Avanzado
Leer guía
Metrics~32 min

Downsampling de métricas con VictoriaMetrics en la versión gratuita

Creada: 10 de abril de 2026 · Publicada: 10 de abril de 2026

VictoriaMetrics Enterprise ofrece downsampling nativo en cluster. En la versión gratuita puedes aproximarlo con clusters separados, fan-out y `-dedup.minScrapeInterval`.

Avanzado
Leer guía
Logs~28 min

Dimensiona shards en OpenSearch con ingesta real

Creada: 9 de abril de 2026 · Publicada: 9 de abril de 2026

Guía avanzada para decidir `number_of_shards` y `max_size` a partir de la ingesta real del índice.

Avanzado
Leer guía
Dashboards~20 min

Grafana para unificar métricas, logs y trazas (multiplataforma)

Creada: 7 de abril de 2026 · Publicada: 7 de abril de 2026

Despliega Grafana, provisiona datasources y deja un espacio listo para explorar métricas, logs y correlación con trazas.

Docker
Intermedio
Leer guía
Logs~18 min

OpenSearch para centralizar logs (multiplataforma)

Creada: 6 de abril de 2026 · Publicada: 6 de abril de 2026

Configura OpenSearch y Dashboards, carga eventos iniciales y valida consultas operativas de logs en cualquier plataforma.

Docker
Principiante
Leer guía
Metrics~16 min

Prometheus para métricas del sistema (multiplataforma)

Creada: 5 de abril de 2026 · Publicada: 5 de abril de 2026

Configura Prometheus y verifica métricas operativas con un flujo reproducible, independientemente del sistema operativo del equipo.

Docker
Principiante
Leer guía
Reliability~12 min

Diseñar SLOs para equipos de plataforma

Creada: 30 de marzo de 2026 · Publicada: 30 de marzo de 2026

Un marco breve para escoger indicadores y objetivos que ayuden a negociar fiabilidad con producto y desarrollo.

Intermedio
Leer guía
OpenTelemetry~18 min

Fundamentos de observabilidad con OpenTelemetry

Creada: 21 de marzo de 2026 · Publicada: 21 de marzo de 2026

Una guía para pasar de instrumentar por moda a responder preguntas operativas reales con logs, métricas y trazas conectadas.

Principiante
Leer guía