Automatización · Notificaciones
Bot de Alertas Telegram
Bot que monitoriza el homelab y envía alertas inteligentes vía Telegram. Cuando algo falla, lo sabes antes de que el usuario lo note.
El servidor cae a las 3 AM.
¿Quién te avisa?
Un homelab sin alertas es infraestructura ciega. Puedes tener los mejores dashboards de Grafana, pero si nadie los mira, un servicio caído puede pasar desapercibido horas. Y los servicios siempre caen fuera del horario laboral.
El reto: construir un sistema de alertas que sea rápido, inteligente y sin falsos positivos. Las alertas ruidosas se ignoran. Las que no llegan no sirven. El equilibrio está en la configuración.
Una alerta que se ignora
es peor que ninguna alerta.
La solución: Prometheus evalúa métricas continuamente, AlertManager aplica reglas de supresión y agrupación, y n8n enriquece la alerta con contexto antes de enviarla por Telegram con formato legible.
Métricas → Reglas → Acción.
El pipeline de alertas tiene tres capas distintas. Cada una con una responsabilidad clara y sin solapamiento.
Uptime Kuma añade una segunda capa de monitorización por disponibilidad HTTP/TCP, complementando las métricas de Prometheus con checks desde fuera de la infraestructura interna.
Quince monitores.
Cero ruido.
Cada tipo de alerta tiene su umbral y su período de evaluación ajustado. Las alertas de disco tienen un período de pendiente largo porque el disco no se llena en segundos. Las de servicio caído son inmediatas.
CPU / Memoria
Alertas cuando CPU supera 85% durante más de 5 minutos o memoria supera 90%.
Disco
Alertas en >80% uso con predicción de llenado. Aviso preventivo 48h antes del límite crítico.
Servicios
Check HTTP/TCP cada 60 segundos. Alerta si un servicio no responde en 3 checks consecutivos.
Conectividad
Monitorización de latencia Tailscale entre nodos y disponibilidad de la conexión WAN.
Infraestructura que
habla contigo.
El bot lleva más de un año sin un solo falso positivo gracias a los períodos de pendiente en AlertManager. Cada alerta incluye: servicio afectado, métrica exacta, duración del problema y un enlace directo al dashboard de Grafana correspondiente.
El tiempo medio desde que ocurre el problema hasta que llega la alerta al móvil: menos de 5 segundos. Sin PagerDuty. Sin Datadog. Sin coste mensual.
- Formato Markdown enriquecido en Telegram con iconos de estado
- Agrupación automática de alertas del mismo servicio
- Comandos de consulta por Telegram: /status, /metrics, /logs
- Integración con n8n para acciones automáticas ante alertas recurrentes