Importancia del monitoreo en DevOps y despliegue continuo

Clase 48 de 53 • Curso de DevOps con GitLab

Contenido del curso

Introducción

Administración

Planificación

Verificación

Empaquetación

Seguridad

Distribución

Monitoreo

Conclusiones

53
Automatización en desarrollo con DevOps y GitLab
02:29 min

Tomar examen

Resumen

El monitoreo en DevOps es indispensable: los cambios frecuentes y los despliegues continuos exigen visibilidad constante de la salud y el performance de la aplicación, la infraestructura y el equipo. Sin datos confiables, tomar decisiones se vuelve lento y arriesgado; con datos claros, las soluciones llegan más rápido.

¿Por qué el monitoreo es crítico en DevOps hoy?

En el modelo Waterfall los cambios eran esporádicos, por lo que monitorear no era prioritario. En DevOps, con continuous deployment varias veces al día, el monitoreo continuo se vuelve clave para detectar degradaciones y anticipar fallos antes de afectar a usuarios. Esto ofrece una capa de seguridad operativa, mejora el tiempo de respuesta y permite optimizar costos o seguridad según la estrategia de cada sistema.

Visibilidad operativa: conocer el estado real de app, infraestructura y equipo.
Prevención: alertar antes de que algo caiga.
Aprendizaje: entender patrones y “líneas base” de métricas normales.

¿Qué buenas prácticas de monitoreo aplican en todos los ambientes?

Monitorear solo producción es insuficiente. Incorporar datos desde etapas previas permite decidir con evidencia y reducir riesgos. Además, automatizar evita errores manuales y acelera la respuesta ante incidentes.

¿Cómo monitorear todos los ambientes y review apps?

Monitorea desarrollo, staging y review apps. Así detectas consumos anómalos de memoria o CPU y evalúas si la infraestructura soporta la carga prevista. Esto habilita decisiones tempranas: escalar para un safety net, o ajustar para optimizar costos o seguridad.

Observa consumo de recursos por versión y por entorno.
Define umbrales acordes al crecimiento esperado.
Revisa patrones de uso para distinguir picos normales de fallos reales.

¿Por qué automatizar el monitoreo y las alertas?

El monitoreo debe ser parte del pipeline: configuración como código y despliegue automático en cada entorno. Genera alertas proactivas para actuar antes de la caída.

Provisiona agentes y paneles de forma automática.
Crea alertas por umbral y por tendencia para anticipar riesgos.
Evita el trabajo manual: reduce errores y acelera respuestas.

¿Cómo compartir datos de salud y performance?

Comparte los datos con toda la empresa a través de reportes periódicos. No es dar acceso total a herramientas, sino informes claros: estado de salud, performance actual y evolución.

Publica tableros ejecutivos con indicadores clave.
Alinea a negocio y tecnología con métricas comunes.
Facilita decisiones de capacidad, costo y prioridad.

¿Cómo usar métricas para resolver bugs sin sesgos?

Ante un bug, el primer recurso son los sistemas de monitoreo. Los errores pueden ser escurridizos; elevar la información correcta “hacia arriba” mejora la visibilidad y acelera la solución.

Usa el monitoreo como punto de partida, no como último recurso.
Centraliza logs, métricas y trazas para ver el contexto.
Prioriza señales que expliquen impacto y causa probable.

Existe además una word of caution: al definir métricas de equipo, las personas tenderán a maximizar lo que se mide. Si solo premias un indicador, eso obtendrás, incluso con efectos no deseados. Diseña tu sistema sabiendo que ese será el resultado en el long.

Mide balanceando velocidad, calidad y estabilidad.
Evita métricas únicas que incentiven atajos.
Revisa y ajusta indicadores con retroalimentación periódica.

¿Tú cómo lo haces hoy? Comparte qué herramientas usas, qué métricas te funcionan y si ya monitoreas tu infraestructura, tu aplicación y tu equipo.

Comentarios

Oscar Adolfo Vargas López

student•

<[](https://github.com/oscar93varlop/cw_alarms)>

en el siguiente enlace se encuentra un script para la automatización de alarmas de cpu/ram/disco que se puede agregar al user_data tanto en un templete de IaC (Terraform o CloudFormation)

Johny Jiménez

student•

Oye excelente repo! Me sirve para mis prácticas!!! Si fuera taringa te daba +10

Omar D

student•

El monitoreo es parte de la operación diaria y una parte importante ya que es uno de los detonantes a los cambios, o tomas de decisiones cuando se detectan incidentes que, de no ser tratados pueden convertirse en un problema. Nosotros aprendimos que cuando generas una estrategia de monitoreo alineada a los objetivos de la empresa exponencías el valor de lo que haces como operación. es por eso que utilizamos señales doradas y medimos por cada plataforma:

Latencia
Trafico
Errores
Saturación

esto nos ha permitido medir eficientemente el comportamiento y predecimos los incidentes

cesar Abril

student•

Nosotros monitoreamos con amplify los nginx y las aplicaciones con keymetrics

Edwin Garcia

student•

Nunca hemos monitoreado la salud de nuestras apps, que recomendaciones dan para monitorear, nunca es tarde...

Wilmer Hugo Acosta Ortiz

student•

Nosotros usamos el PRTG para el monitoreo de servidores y sservicios, pero la verdad creo que a este sistema le hace falta pulir un poco la parte de las alertas, aveces nos pasa que un disco se empieza a llenar y son alertas tras alertas del mismo disco que no siempre es prioritario, pasa que llegas al siguente dia y tienes millon correos en tu bandeja.

Ricardo Antonio Rodriguez Valdez

student•

ELK stack para la red y algunas cosas y para los servers netdata.

Julian Parra

student•

En la empresa usamos Datadog para monitorear eventos del sistema, inclusive eventos personalizados. También ofrece un panel para hacer métricas , operaciones y gráficas para abstraer la información de cada evento.

Eduard Leandro Correa Avendano

student•

En mi caso monitoreamos los Portales con Instana, antes usabamos Datadog, este tipo de aplicaciones son conocidas como APM (Application Performance Management). Dentro de AWS usamos XRay y CloudWatch para monitorear los microservicios.

Jose Almenarez

student•

Nosotros en la empresa monitoreamos con instana un APM pero solo en el ambiente productivo ya que hay que pagar licencia por agente y es bastante costosa.

Pablo Aquino

student•

Yo he usado nagios, para el monitoreo de la infraestructura de servidores, pero no lo había orientado para el monitoreo de apps.

Jose SRE

student•

Para evitar la llamada en la madrugada de " Se cayo el servidor ! " es posible que se puedan agregar condicionales para hacer un rollback si el monitoreo detecta que algo esta apunto de fallar ?

Jose Antonio Padron Fernandez

student•

Es posible pero es mas complicado de lo que parece, puede que el rollback no te funcione en todos los casos.

Helí Fernando Jerez Rincón

student•

Lo importante es tener un changelog de los cambios a pasar con su procedimiento de reversión.

Lo más difícil en un rollback, por ejemplo en el sector financiero es arreglar los datos que se vieron afectados. reversar las transacciones y ejecutar sentencias que deben hacerse con un cuidado y un procedimiento que involucre muchas manos para evitar el error humano.

Pasó una vez que se ejecuto un query sobre un ambiente para arreglar y el query no se paso por un flujo y termino dañando todos los registros y el rollback se demoró aún más porque tocó bajar el sistema total, restaurar backup y ejecutar el query correcto.

Salvador Castro

student•

Debe ser como el pan de cada día!!

Importancia del monitoreo en DevOps y despliegue continuo

Introducción

DevOps con GitLab para automatizar entregas de software

Qué es DevOps y cómo integra desarrollo con operaciones

DevOps como ciclo iterativo continuo: etapas y beneficios clave

GitLab como plataforma integral para el ciclo de vida DevOps

Diferencias clave entre GitLab y GitHub para desarrolladores

Administración

Configuración de autenticación segura en GitLab

Grupos y subgrupos de GitLab para organizar proyectos y permisos

Gestión de permisos y colaboradores en GitLab

Rastros de auditoría en GitLab para administración segura

Creación y configuración de proyectos en GitLab

Planificación

Diferencias entre Agile y Waterfall en desarrollo de software

Creación y gestión de issues en GitLab para colaboración eficaz

Etiquetas para organizar issues en GitLab

Planificación en Gitlab-Pesos

Creación y gestión de milestones en GitLab para sprints y releases

Boards en GitLab para visualizar flujos de trabajo con issues

Service Desk de GitLab para soporte por correo electrónico

Planificación en Gitlab-Quick actions

Verificación

Inicialización de Angular con GitLab y test-driven development

Merge requests y control de calidad en GitLab

Flujo completo de merge requests en GitLab

Automatización de flujos de trabajo con GitLab CI

GitLab CI: configuración, stages y variables para automatización

Configuración de GitLab CI para proyectos Angular

Validación de archivos GitLab CI con linter antes del pipeline

gitlab-ci.yml

Configuración de GitLab Pages para hosting estático con CI

Configuración de GitLab Pages para deploy automático de Angular

Desarrollo ágil y sus doce principios fundamentales

GitLab AutoDevOps: pipelines automatizados con seguridad y calidad

Configuración de GitLab Auto DevOps con Kubernetes en Google Cloud

Configuración de Auto DevOps en GitLab con Kubernetes

Empaquetación

Integración de GitLab Container Registry con Auto DevOps

Introducción a contenedores

Seguridad

DevSecOps: integración de seguridad en el ciclo de desarrollo

Autenticación de commits con llaves PGP en GitLab

Pruebas estáticas de seguridad en GitLab para detectar vulnerabilidades

Análisis de contenedores con GitLab y Clair para detectar vulnerabilidades

Análisis de vulnerabilidades en dependencias de NPM, PIP y Composer

Pruebas dinámicas de seguridad con DAST en GitLab

GitLab Security Dashboard: hub centralizado de vulnerabilidades

Distribución

Continuous Deployment seguro con GitLab y control de riesgos

Configuración de ambientes en GitLab para desarrollo industrial

Review apps: ambientes efímeros por branch para feedback rápido

Estrategias de Distribución

Feature Flags

Rollback en GitLab para revertir errores en producción

Monitoreo

Importancia del monitoreo en DevOps y despliegue continuo

Métricas de desempeño en GitLab con Prometheus

Métricas de salud en GitLab para prevenir fallas de infraestructura

Métricas de equipo en GitLab para optimizar workflows de DevOps

Integración de GitLab con Sentry para rastrear errores en producción

Conclusiones

Automatización en desarrollo con DevOps y GitLab