Elasticache y DAX

Clase 40 de 69 • Curso de AWS Certified Solutions Architect Associate

Resumen

El uso de estrategias de caché es fundamental para optimizar aplicaciones con uso intensivo de lecturas. Amazon ofrece soluciones específicas para empresas que necesitan minimizar la latencia sin modificar sus aplicaciones existentes. Descubre cómo implementar capas intermedias de caché que mejoran drásticamente el rendimiento y proporcionan respuestas casi instantáneas a tus usuarios.

¿Qué son las estrategias de caché y por qué son importantes?

Una estrategia de caché consiste en implementar una capa intermedia entre el usuario y el origen de datos (base de datos, página web estática, bucket de S3, etc.). Esta capa mantiene una copia de la información del origen y puede responder a las solicitudes de los usuarios de manera mucho más rápida, reduciendo significativamente la latencia.

Las estrategias de caché son particularmente importantes cuando enfrentamos casos de uso donde los usuarios necesitan realizar operaciones de lectura frecuentes y requieren tiempos de respuesta extremadamente bajos. Como en el caso mencionado de la empresa de entretenimiento que utiliza Amazon DynamoDB para almacenar metadatos multimedia y experimenta retrasos debido a su uso intensivo de lecturas.

¿Qué servicios de caché ofrece AWS?

AWS proporciona dos servicios principales para gestionar caché de forma provisionada:

DynamoDB Accelerator (DAX)

DAX es una solución específica para DynamoDB que permite:

Responder a consultas en microsegundos (en comparación con los milisegundos de DynamoDB estándar)
Utiliza la misma API que DynamoDB, lo que significa que no es necesario reescribir aplicaciones ni agregar lógica adicional en el código
Funciona como una capa intermedia transparente para la mayoría de las aplicaciones

La arquitectura típica coloca a DAX como intermediario entre los usuarios y DynamoDB, acelerando drásticamente las operaciones de lectura sin cambios en la aplicación.

Amazon ElastiCache

ElastiCache ofrece dos productos distintos para diferentes necesidades:

ElastiCache para Redis:
- Versión gestionada del popular sistema de caché open source Redis
- Ofrece replicaciones y snapshots de respaldo
- Ideal para almacenar objetos con diferentes estructuras (no solo strings, sino también estructuras de objetos complejos, bytes, etc.)
- Mayor versatilidad para diferentes tipos de datos
ElastiCache para Memcached:
- Servicio creado y gestionado por AWS
- Caso de uso más simple: principalmente para almacenamiento de pares clave-valor
- Mayor velocidad de respuesta y facilidad de escalado comparado con Redis
- Optimizado para operaciones sencillas de caché

¿Cómo elegir la mejor estrategia de invalidación de caché?

Al implementar caché, es crucial definir cómo se actualizará la información cuando ocurran cambios en el origen. AWS ofrece varias estrategias de invalidación:

Lazy Loading (carga perezosa)

Funcionamiento: Se escribe primero en el origen y posteriormente, cuando hay recursos disponibles, se actualiza el caché
Ventajas: Estrategia simple de implementar
Desventajas: Mayor latencia en la primera solicitud, pero funciona eficientemente en solicitudes subsecuentes

Write Through (escritura simultánea)

Funcionamiento: Se escribe simultáneamente tanto en caché como en el origen
Ventajas: Alta consistencia; todas las lecturas obtienen la versión más reciente
Desventajas: Agrega algo de latencia a las operaciones de escritura

Write Behind (escritura posterior)

Funcionamiento: Se escribe primero en caché y posteriormente el caché replica los cambios al origen
Ventajas: Mejor latencia en operaciones de escritura
Desventajas: Puede crear inconsistencias temporales entre diferentes lecturas

Invalidación por TTL (Time To Live)

Funcionamiento: Se define un tiempo específico durante el cual cada objeto se considera válido en caché
Ventajas: Permite personalizar la frecuencia de actualización según la naturaleza de los datos
Implementación: Para datos que raramente cambian, se puede establecer un TTL largo (meses o años), mientras que para datos que se actualizan frecuentemente, se utilizan TTLs cortos (segundos o minutos)

La estrategia de invalidación por TTL es especialmente útil cuando diferentes tipos de datos tienen diferentes patrones de actualización, permitiendo optimizar el rendimiento y la consistencia de manera granular.

¿Cómo aplicar estas soluciones a casos específicos?

Para el caso mencionado de la empresa de entretenimiento que utiliza DynamoDB para metadatos multimedia, la solución más adecuada sería implementar DynamoDB Accelerator (DAX). Esta solución:

No requiere reconfiguración de la aplicación (utiliza la misma API que DynamoDB)
Reduce drásticamente la latencia (de milisegundos a microsegundos)
No necesita personal adicional para gestionar la carga operativa

Con DAX, la empresa puede mejorar el rendimiento de las operaciones de lectura intensivas sin modificar su aplicación existente, lo que representa la solución ideal para sus necesidades específicas y limitaciones de personal.

Las estrategias de caché son fundamentales para optimizar aplicaciones con alto volumen de lecturas. La elección entre DAX, ElastiCache para Redis o ElastiCache para Memcached, combinada con la estrategia de invalidación adecuada, puede transformar drásticamente el rendimiento de tus aplicaciones. ¿Qué estrategia de caché utilizas actualmente en tus proyectos? ¿Has experimentado con diferentes métodos de invalidación?

Comentarios

Gustavo Bautista Hernández

student•

La respuesta correcta es la Opción B:

"Usar Amazon DynamoDB Accelerator (DAX)."

¿Por qué es la respuesta correcta?

DAX es la solución perfecta para este escenario porque:

Diseñado específicamente para DynamoDB: DAX es una capa de caché en memoria completamente administrada y nativa para DynamoDB.
Mejora el rendimiento de lecturas: Reduce la latencia de microsegundos de DynamoDB a microsegundos de un solo dígito para operaciones de lectura.
Totalmente administrado: No requiere personal adicional para gestionar la carga operativa - AWS se encarga de todo (parches, actualizaciones, escalado, etc.).
Sin cambios en la aplicación: Requiere cambios mínimos en el código - solo cambiar el endpoint de conexión de DynamoDB al endpoint de DAX.
Ideal para cargas de trabajo con uso intensivo de lectura: El enunciado específicamente menciona "uso intensivo de recursos de lectura".
Reduce la carga en DynamoDB: Al cachear las lecturas más frecuentes, disminuye la cantidad de operaciones directas a DynamoDB.

¿Por qué las otras opciones no son correctas?

Opción A - "Usar Amazon ElastiCache para Redis.":

Requiere gestión adicional: Necesitas configurar, mantener y gestionar el cluster de Redis
Cambios significativos en la aplicación: Debes implementar toda la lógica de caché (cache-aside pattern, invalidación, etc.)
Carga operativa: Requiere personal para gestionar Redis, monitoreo, ajustes de configuración
No es la opción más simple: Contradice el requisito de "no dispone de personal para gestionar la carga operativa adicional"

Opción C - "Replicar los datos mediante tablas globales de DynamoDB.":

No resuelve el problema de rendimiento de lectura: Las tablas globales son para replicación multi-región, no para mejorar el rendimiento de lectura en una sola región
No reduce la carga operativa: Añade complejidad
Propósito diferente: Las tablas globales son para alta disponibilidad y baja latencia geográfica, no para cachear lecturas intensivas
No aborda el problema principal: Los metadatos multimedia probablemente no necesitan estar en múltiples regiones

Opción D - "Usar Amazon ElastiCache para Memcached con la función de descubrimiento automático activada.":

Mismos problemas que la Opción A: Requiere gestión operativa
Necesita código personalizado: Debes implementar la lógica de caché en tu aplicación
Carga operativa adicional: Requiere administrar el cluster de Memcached
Más complejo: Auto-discovery ayuda, pero aún así necesitas gestionar el servicio

Miguel Angel Reyes Moreno

student•

El título de la clase te da la respuesta jajaj, muy buena explicación, compañero

Elasticache y DAX

Fundamentos de AWS

Certificación AWS Solutions Architect Associate: Fundamentos y Preparación

Preparación para certificación AWS Arquitecto de Soluciones

Configuración de presupuestos en AWS para controlar costos

AWS Well Architected Framework: Los 6 pilares para arquitectura sólida

Identidad, Acceso y Gobernanza Multicuenta

IAM: Primeros Pasos en AWS

Creación de usuarios administrador y practicante en AWS IAM

Profundización en IAM

Análisis de accesos externos con AWS Access Analyzer

AWS Organizations versus Control Tower para múltiples cuentas

Servicios de Computo en AWS

Servicios de cómputo AWS: EC2, procesadores Graviton y AMIs

Opciones de Compra en EC2

Lanzamiento de una instancia EC2 desde la consola de AWS

Caracteristicas adicionales de EC2

Consulta de metadatos de instancia con IMDS v2 en AWS

AWS Outpost para ejecutar servicios localmente con latencia baja

Despliegue de aplicaciones web con AWS Elastic Beanstalk

Contenedores en AWS

Contenedores

Gestión de imágenes de contenedores con ECR y Fargate

Configuración de clusters, tareas y servicios en Amazon ECS

Redes en AWS

Direccionamiento IP y bloques CIDR para redes AWS

Anatomia y funcionamiento de la VPC

Configuración de instancias públicas y privadas con NAT Gateway

Seguridad de VPC con NACL y grupos de seguridad en AWS

Configuración de grupos de seguridad para instancias públicas

Conectividad híbrida en AWS: VPC Peering, Transit Gateway y Endpoints

Escalamiento y balanceo en AWS

Elastic Load Balancer (ELB) , tipos y caracteristicas

Configuración de balanceadores de carga en AWS para alta disponibilidad

Auto Scaling en AWS

Configuración de grupos de autoescalamiento en AWS

Almacenamiento en AWS

Introducción al modulo y niveles de almacenamiento

Diferencias entre Instance Store y EBS en AWS

EFS & FSx

Creación y configuración de volúmenes EBS en AWS

S3

Configuración de EFS para compartir almacenamiento entre instancias

Recuperación de objetos eliminados con versionamiento en AWS S3

Bases de datos en AWS

Bases de datos relacionales vs no relacionales en AWS

DynamoDB

Creación y configuración de bases de datos Dynamo en AWS

Elasticache y DAX

Escalabilidad y alta disponibilidad con AWS RDS y Aurora

Configuración de Aurora en AWS RDS para alta disponibilidad

Migración en AWS

Estrategias de migración AWS: las 6 R para trasladar aplicaciones

Online

Migración de datos con AWS Snow Family: opciones y características

Migración de bases de datos con DMS y Schema Conversion Tool

Monitoreo y Auditoria en AWS

CloudTrail y EventBridge para auditoría y automatización en AWS

Monitoreo con AWS CloudWatch: dashboards, métricas y alarmas

DNS y CDN en AWS

Zonas locales y de borde de AWS para baja latencia

CloudFront y Global Accelerator para optimizar latencia y velocidad

Route 53

Configuración de políticas de geoproximidad en AWS Route 53

Servicios de Seguridad

KMS & CloudHSM

Protección contra ataques DDoS y web con AWS Shield y WAF

Guarduty & Inspector & Detective & Trusted advisor

GuardDuty y Trusted Advisor para detectar amenazas en AWS

Serverless

API Gateway y AWS Lambda: fundamentos para aplicaciones serverless

Creación y configuración de funciones Lambda para automatización

AWS SQS: Tipos de filas y configuración para arquitecturas serverless

AWS SNS y Step Functions para comunicación y workflows visuales

Servicios de Datos en AWS

Servicios de datos principales en AWS para análisis empresarial

Kinesis, EMR, Glue

Redshift, Athena, Lake formation

Servicios de AI y ML em AWS

Servicios de inteligencia artificial de AWS explicados