Automatización · Notificaciones

Bot de Alertas Telegram

Bot que monitoriza el homelab y envía alertas inteligentes vía Telegram. Cuando algo falla, lo sabes antes de que el usuario lo note.

python python-telegram-bot prometheus n8n docker

24/7

Online

<5s

Alerta

15+

Monitores

Falsos positivos

El Reto

El servidor cae a las 3 AM.
¿Quién te avisa?

Un homelab sin alertas es infraestructura ciega. Puedes tener los mejores dashboards de Grafana, pero si nadie los mira, un servicio caído puede pasar desapercibido horas. Y los servicios siempre caen fuera del horario laboral.

El reto: construir un sistema de alertas que sea rápido, inteligente y sin falsos positivos. Las alertas ruidosas se ignoran. Las que no llegan no sirven. El equilibrio está en la configuración.

Una alerta que se ignora
es peor que ninguna alerta.

La solución: Prometheus evalúa métricas continuamente, AlertManager aplica reglas de supresión y agrupación, y n8n enriquece la alerta con contexto antes de enviarla por Telegram con formato legible.

Arquitectura

Métricas → Reglas → Acción.

El pipeline de alertas tiene tres capas distintas. Cada una con una responsabilidad clara y sin solapamiento.

// pipeline de alertas

Métricas

Prometheus

Scrape cada 15s

→

Reglas

AlertManager

Agrupación · Supresión

→

Enriquecimiento

n8n Flow

Contexto + formato

→

Notificación

Telegram Bot

Mensaje formateado

live

Uptime Kuma añade una segunda capa de monitorización por disponibilidad HTTP/TCP, complementando las métricas de Prometheus con checks desde fuera de la infraestructura interna.

Alertas

Quince monitores.
Cero ruido.

Cada tipo de alerta tiene su umbral y su período de evaluación ajustado. Las alertas de disco tienen un período de pendiente largo porque el disco no se llena en segundos. Las de servicio caído son inmediatas.

recurso

CPU / Memoria

Alertas cuando CPU supera 85% durante más de 5 minutos o memoria supera 90%.

almacenamiento

Disco

Alertas en >80% uso con predicción de llenado. Aviso preventivo 48h antes del límite crítico.

disponibilidad

Servicios

Check HTTP/TCP cada 60 segundos. Alerta si un servicio no responde en 3 checks consecutivos.

red

Conectividad

Monitorización de latencia Tailscale entre nodos y disponibilidad de la conexión WAN.

Resultado

Infraestructura que
habla contigo.

El bot lleva más de un año sin un solo falso positivo gracias a los períodos de pendiente en AlertManager. Cada alerta incluye: servicio afectado, métrica exacta, duración del problema y un enlace directo al dashboard de Grafana correspondiente.

El tiempo medio desde que ocurre el problema hasta que llega la alerta al móvil: menos de 5 segundos. Sin PagerDuty. Sin Datadog. Sin coste mensual.

Formato Markdown enriquecido en Telegram con iconos de estado
Agrupación automática de alertas del mismo servicio
Comandos de consulta por Telegram: /status, /metrics, /logs
Integración con n8n para acciones automáticas ante alertas recurrentes

Python python-telegram-bot Prometheus AlertManager n8n Uptime Kuma Docker

← Volver Todos los proyectos IT ↗ Siguiente Proyecto · IT Vaultwarden →