Configuración de alertas paramétricas para métricas de infraestructura
Clase 13 de 23 • Curso de Observabilidad Avanzada con New Relic
Contenido del curso
- 2

Qué es el monitoreo del rendimiento de aplicaciones (APM) y sus señales doradas
04:44 - 3

Configuración avanzada de APM en New Relic: mejores prácticas
09:59 - 4

Análisis de transacciones y métricas personalizadas en New Relic
17:21 - 5

Seguimiento de cambios en New Relic con GitHub Actions
16:44 - 6

Métricas personalizadas y seguimiento de cambios en tableros de New Relic
05:58 - 7

Implementación de métricas personalizadas con New Relic APM
02:07 quiz de Advanced APM
- 8

Monitoreo de infraestructura con New Relic: métricas y registros
03:10 - 9

Instalación del agente de infraestructura de New Relic en Docker
10:26 - 10

Configuraciones básicas del agente de infraestructura de New Relic
14:29 - 11

Métricas de infraestructura en New Relic: CPU, memoria y red
09:43 - 12

Creación de paneles de infraestructura en New Relic
05:26 - 13

Configuración de alertas paramétricas para métricas de infraestructura
09:13 - 14

Configuración de integraciones personalizadas con New Relic Flex
09:27 - 15

Proyecto final: crea tu integración Flex para New Relic
00:31 quiz de Infrastructure Agent
- 16

Gestión eficiente de registros con New Relic en sistemas distribuidos
02:40 - 17

Envío de registros a New Relic mediante API directa
07:47 - 18

Consultas de logs con Lucene y NRQL en New Relic
09:31 - 19

Conversión de logs no estructurados a datos estructurados con GroK
10:46 - 20

Particiones de datos para gestionar logs de gran volumen
12:24 - 21

Los registros en contexto conectan datos de APM con rastreo de errores
06:25 - 22

Configuración de ingesta de logs para dashboards de monitoreo
00:36 quiz de Logs
Optimizar el monitoreo de infraestructura es esencial para anticiparte a los problemas y mantener un rendimiento estable en tus sistemas. Configurar alertas específicas mediante herramientas como New Relic te ayuda a identificar y solucionar inconvenientes antes de que afecten a los usuarios. Aquí exploraremos cómo establecer alertas paramétricas para métricas críticas como el uso de memoria.
¿Por qué configurar alertas paramétricas críticas en New Relic?
Una buena estrategia de monitoreo implica ser proactivo. Las alertas te permiten anticiparte al impacto de problemas, y especialmente cuando se aplican a infraestructura crítica, son fundamentales para mantener un entorno tecnológico saludable. Por ejemplo, en el caso del uso de memoria, es recomendable preocuparse cuando al menos un 70% está siendo consumido, con el 80% considerado alarmante si se mantiene por un período extendido.
¿Cómo establecer umbrales efectivos para alertas de infraestructura?
La configuración de condiciones de alerta parte de comprender tu métrica elegida. Tomando como ejemplo el uso de memoria:
- Primero, identifica en New Relic mi métrica clave, como el uso de memoria en Space Rover Infrastructure.
- Selecciona la opción "crear condición de alerta" desde el menú del gráfico de la métrica.
- Confirma que la consulta automática se ejecute correctamente.
- Define umbrales concretos según los valores críticos identificados (más de 70% uso sostenido por 5 minutos como advertencia y más de 80% como crítico).
La ventana recomendada para evaluar un uso sostenido es de al menos cinco minutos. Esto permite verificar que el problema sea persistente y no un pico momentáneo en la utilización, ayudando a prevenir falsos positivos.
¿Qué método utilizar para métricas constantes?
En métricas constantes, como uso de memoria, el método "transmisión de flujo de eventos" es el idóneo. Este enfoque es eficaz debido a la frecuencia regular con que se reportan los datos.
¿Qué elementos incluir en una política de alertas efectiva?
Cada alerta se asocia con una política específica que puede agrupar distintos tipos de condiciones:
- Define una nomenclatura clara para la condición y la política, por ejemplo, “alto uso de memoria” y “señales doradas de infraestructura”.
- Elige cómo agrupar incidentes. En general, "un problema por condición" es útil cuando se manejan múltiples condiciones.
- Utiliza "correlacionar y suprimir ruido" para evitar alertas innecesarias debido a valores atípicos, disminuyendo así interrupciones entendiendo patrones puntuales.
Opcionalmente, detalla planes de acción (runbooks) con enlaces específicos para que el equipo sepa cómo abordar rápidamente el incidente cuando surja.
¿Cómo gestionar las notificaciones de alerta adecuadamente?
Organizar los canales de comunicación es clave para una respuesta rápida y efectiva:
- Define claramente el flujo de trabajo y el canal de notificación, por ejemplo mediante correo electrónico.
- Especifica destinatarios y variables contextuales para enriquecer la información suministrada en la alerta.
- Guarda y prueba tu configuración para garantizar que las notificaciones sean claras y efectivas.
¿Qué métrica consideras esencial monitorear en tu stack particular y cómo configurarías las alertas correspondientes? Comparte tu experiencia y enfoques mediante los comentarios.