Contenido del curso

Agente de Infraestructura

Monitoreo de infraestructura con New Relic

Resumen

Cuando una aplicación falla, muchas veces el problema no está en el código sino debajo: en los servidores, contenedores o servicios en la nube que la sostienen. El monitoreo de infraestructura de New Relic te da visibilidad sobre esa base del stack tecnológico para que entiendas qué pasa en tiempo real con tus hosts, integraciones y registros. Está pensado para equipos de desarrollo y operaciones que necesitan reducir el tiempo de respuesta ante incidentes.

¿Qué incluye el monitoreo de infraestructura de New Relic?

Hasta ahora has visto cómo monitorear el rendimiento de aplicaciones con APM, pero esa es solo una capa. La infraestructura es la otra mitad de la historia, y aquí es donde entra una solución más amplia.

La propuesta de New Relic en este frente cubre cuatro frentes concretos:

  • Información sobre la salud y el rendimiento de tus hosts.
  • Métricas en tiempo real de todos los componentes y herramientas de tu infraestructura.
  • Un inventario completo de esos componentes y herramientas.
  • Visibilidad de los eventos en tiempo real a lo largo de tu infraestructura.

¿Qué es el monitoreo de infraestructura? Es la práctica de observar el estado y rendimiento de los servidores, contenedores y servicios en la nube que ejecutan tus aplicaciones, para detectar problemas antes de que afecten al usuario.

¿Cómo funciona el agente de infraestructura?

En el centro de la solución está el agente de infraestructura, una pieza de software que recolecta métricas de rendimiento y salud de los componentes principales y extiende el monitoreo a herramientas como Kubernetes o Prometheus.

Este agente también recopila los registros de todos los componentes y los envía a la plataforma, donde quedan disponibles en New Relic Logs. Es compatible con la mayoría de sistemas operativos: Mac, Windows y Linux.

¿Y si trabajas en la nube?

Si usas un proveedor como Amazon AWS, Microsoft Azure o Google Cloud Platform, no necesitas instalar nada. Solo vinculas la cuenta de tu proveedor con tu cuenta de New Relic y la plataforma descubre automáticamente todos los componentes de infraestructura de esa cuenta.

¿Qué integraciones ya están listas?

La lista de integraciones nativas cubre las herramientas más comunes en infraestructura moderna:

  • Kubernetes y Prometheus para orquestación y métricas.
  • Nginx y Apache como servidores web.
  • MySQL y Redis para datos y caché.
  • RabbitMQ para mensajería.

Y si tu herramienta no está en esa lista, existe New Relic Flex, que te permite crear integraciones personalizadas. Solo necesitas un archivo yaml sencillo donde definas los datos que quieres recopilar, y la plataforma se encarga de recibirlos.

¿Por qué importan los registros en contexto?

Al igual que el agente de APM, el agente de infraestructura puede recopilar y enviar registros a la plataforma. Esto habilita lo que se conoce como registros en contexto, una de las funciones más útiles para depurar.

¿La idea? Cuando estás viendo un componente específico, la plataforma correlaciona automáticamente los registros asociados con ese componente en una sola vista. Ya no tienes que saltar entre herramientas para entender qué pasó.

¿Qué son los registros en contexto? Es la capacidad de ver los logs de un componente directamente junto a sus métricas, sin cambiar de pantalla, lo que acelera el diagnóstico de incidentes.

¿Qué beneficios reales aporta a tu equipo?

Tener una sola plataforma para todos tus datos de infraestructura cambia la forma en que operas. La promesa concreta gira alrededor de tres ideas:

  • Monitoreo sin retrasos, que impulsa el análisis en tiempo real.
  • Integración de registros y datos de infraestructura, para resolver problemas más rápido.
  • Reducción del tiempo medio de reparación (MTTR), porque obtienes información accionable para resoluciones rápidas.

A esto se suma la seguridad de datos de extremo a extremo sobre todos tus datos de infraestructura, algo crítico cuando manejas información sensible de producción.

¿Qué es el MTTR? Es el tiempo medio de reparación, una métrica que mide cuánto tarda tu equipo en resolver un incidente desde que se detecta hasta que se restablece el servicio.

Conceptos y herramientas clave de la clase

Para que puedas ubicar cada idea en su lugar, estos son los términos centrales que aparecen y por qué importan:

  • Agente de infraestructura: software que recolecta métricas, eventos y registros de tus hosts y los envía a New Relic.
  • New Relic Logs: producto donde quedan disponibles los registros enviados por el agente para búsqueda y correlación.
  • New Relic Flex: solución para crear integraciones personalizadas mediante archivos yaml cuando no existe una integración nativa.
  • Registros en contexto: vista unificada que correlaciona logs con el componente que estás inspeccionando.
  • Integraciones nativas: conexiones predefinidas con Kubernetes, Prometheus, Nginx, MySQL, Apache, Redis y RabbitMQ.
  • Vinculación con proveedores cloud: alta automática de componentes al conectar cuentas de AWS, Azure o GCP sin instalar agentes.

Ahora te toca a ti: piensa en una vez en la que un problema que parecía de aplicación terminó siendo de infraestructura. ¿Qué pasó y cómo lo detectaste? Cuéntalo en los comentarios y comparte cómo un mejor monitoreo te habría ahorrado tiempo.