No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

¿Por qué monitorear?

48/53
Recursos

Cuando el codebase era relativamente estático, operations no se preocupaba mucho del monitoreo, pero ahora con la llegada de DevOps y con cambios muy frecuentes al ambiente, el monitoreo se vuelve indispensable.

Best practices:

  • Monitorea todos los ambientes(incluyendo review apps).
  • Familiarizate con las métricas ““normales”” de tu aplicación.
  • Automatiza el monitoreo.
  • Comparte los datos con el resto de la organización.
    – Reportes.
    – Accesos privilegiados.
  • Monitorea aplicación, infraestructura y equipo.

Aportes 11

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

<[](https://github.com/oscar93varlop/cw_alarms)>

en el siguiente enlace se encuentra un script para la automatización de alarmas de cpu/ram/disco
que se puede agregar al user_data tanto en un templete de IaC (Terraform o CloudFormation)

El monitoreo es parte de la operación diaria y una parte importante ya que es uno de los detonantes a los cambios, o tomas de decisiones cuando se detectan incidentes que, de no ser tratados pueden convertirse en un problema.
Nosotros aprendimos que cuando generas una estrategia de monitoreo alineada a los objetivos de la empresa exponencías el valor de lo que haces como operación.
es por eso que utilizamos señales doradas y medimos por cada plataforma:

  • Latencia
  • Trafico
  • Errores
  • Saturación

esto nos ha permitido medir eficientemente el comportamiento y predecimos los incidentes

Nosotros monitoreamos con amplify los nginx y las aplicaciones con keymetrics

Nunca hemos monitoreado la salud de nuestras apps, que recomendaciones dan para monitorear, nunca es tarde…

Nosotros usamos el PRTG para el monitoreo de servidores y sservicios, pero la verdad creo que a este sistema le hace falta pulir un poco la parte de las alertas, aveces nos pasa que un disco se empieza a llenar y son alertas tras alertas del mismo disco que no siempre es prioritario, pasa que llegas al siguente dia y tienes millon correos en tu bandeja.

ELK stack para la red y algunas cosas y para los servers netdata.

En la empresa usamos Datadog para monitorear eventos del sistema, inclusive eventos personalizados. También ofrece un panel para hacer métricas , operaciones y gráficas para abstraer la información de cada evento.

En mi caso monitoreamos los Portales con Instana, antes usabamos Datadog, este tipo de aplicaciones son conocidas como APM (Application Performance Management). Dentro de AWS usamos XRay y CloudWatch para monitorear los microservicios.

Nosotros en la empresa monitoreamos con instana un APM pero solo en el ambiente productivo ya que hay que pagar licencia por agente y es bastante costosa.

Yo he usado nagios, para el monitoreo de la infraestructura de servidores, pero no lo había orientado para el monitoreo de apps.

Debe ser como el pan de cada día!!