Contenido del curso
Identidad, Acceso y Gobernanza Multicuenta
Servicios de Computo en AWS
- 10

Servicios de cómputo AWS: EC2, procesadores Graviton y AMIs
12:14 min - 11

Compute Savings Plan para EC2 y Lambda
04:42 min - 12

Cómo lanzar tu primera instancia EC2
09:10 min - 13

Optimizar latencia en EC2 con tenencia dedicada
09:25 min - 14

Cómo consultar metadatos de EC2 con IMDSv2
04:30 min - 15

AWS Outposts: ejecutar AWS en tu data center
05:53 min - 16

Despliegue de app web en Elastic Beanstalk
19:45 min
Contenedores en AWS
Redes en AWS
- 20

Direccionamiento IP y bloques CIDR para redes AWS
10:21 min - 21

NAT Gateway para subredes privadas en AWS
06:42 min - 22

Configuración de instancias públicas y privadas con NAT Gateway
07:26 min - 23

NACL y Security Groups en AWS
05:35 min - 24

Cómo reparar un Security Group en EC2
03:51 min - 25

Conectividad híbrida en AWS: VPC Peering, Transit Gateway y Endpoints
04:36 min
Escalamiento y balanceo en AWS
Almacenamiento en AWS
- 30

Tipos de almacenamiento en AWS: EBS, EFS y S3
04:58 min - 31

Instance Store vs EBS en AWS
11:05 min - 32

EFS vs FSx para compartir archivos en AWS
02:37 min - 33

Creación y configuración de volúmenes EBS en AWS
03:55 min - 34

Transfer Acceleration para datos globales en S3
15:33 min - 35

Configuración de EFS para compartir almacenamiento entre instancias
08:50 min - 36

Recuperar objetos borrados en Amazon S3
03:41 min
Bases de datos en AWS
- 37

Bases de datos relacionales vs no relacionales en AWS
03:30 min - 38

Cómo funciona DynamoDB en AWS
08:09 min - 39

Creación y configuración de bases de datos Dynamo en AWS
10:17 min - 40

Elasticache y DAX
04:22 min - 41

RDS vs Aurora: réplicas y alta disponibilidad
09:17 min - 42

Cómo configurar Aurora con alta disponibilidad en RDS
11:17 min
Migración en AWS
Monitoreo y Auditoria en AWS
DNS y CDN en AWS
Servicios de Seguridad
Serverless
Servicios de Datos en AWS
Servicios de AI y ML em AWS
Servicios de Backup y Recuperación ante desastres
Architect Solutions Certificate
Servicios de datos en AWS para tu examen
Resumen
Los servicios de datos en AWS son una pieza clave para cualquier persona que se prepara para una certificación de nivel fundamental o asociado. Aquí entenderás qué hace cada uno, para qué casos de uso sirve y por qué los datos importan tanto dentro de una estrategia cloud moderna.
La información que manejas sobre clientes internos y externos es uno de los activos más valiosos de tu empresa. Con esos datos puedes crear nuevos productos, mejorar la experiencia de usuario y, sobre todo, alimentar modelos de inteligencia artificial. Y es justo ahí donde AWS entra con un catálogo amplio de servicios pensados para distintos momentos del ciclo de vida del dato.
¿Por qué los datos son tan importantes en AWS?
La explosión de la inteligencia artificial se apalanca de los datos. Antes de entrenar un modelo o construir un dashboard, necesitas limpiar, transformar y minar la información. AWS ofrece una ruta completa de capacitación y certificación enfocada solo en datos, pero para tu examen actual basta con dominar las bases.
¿Qué servicios de AWS sirven para analizar datos en S3? Athena para consultas SQL, Glue para procesos ETL, Redshift como warehouse y Lake Formation para construir un data lake completo sobre S3.
¿Qué servicios de AWS debes conocer para gestionar datos?
Cada servicio resuelve un problema específico. Conocer su mensaje principal y sus limitaciones te ahorra confusiones en el examen y en la práctica real.
¿Cómo consultar datos en S3 con Athena?
Athena te permite hacer consultas interactivas usando Structured Query Language directamente sobre los objetos almacenados en tus buckets de S3. Es totalmente serverless, lo administra AWS por completo y se integra de forma natural con Glue.
El modelo de cobro es por consulta, así que pagas solo por lo que escaneas. Ideal cuando necesitas explorar logs, archivos CSV o JSON sin montar infraestructura.
¿Qué hace AWS Glue y cuándo usarlo?
Glue es el servicio de ETL gestionado de AWS. ETL significa Extract, Transform and Load: extraer información de una fuente, transformarla y cargarla en un destino.
Lo interesante de Glue está en tres puntos:
- Genera el código ETL de forma automática.
- Centraliza el catálogo de datos para que otros servicios lo consuman.
- No requiere que administres servidores.
¿Qué diferencia hay entre Athena y Glue? Athena consulta datos donde están; Glue los mueve y transforma para dejarlos listos para análisis.
¿Para qué sirve Amazon Redshift?
Redshift es un almacén de datos en columna de alta velocidad, lo que en inglés conocemos como data warehouse. Está pensado para escalar a volúmenes muy grandes sin perder rendimiento.
Se integra bien con herramientas de Business Intelligence y con plataformas ETL externas, así que suele ser la pieza final en una arquitectura analítica donde los datos ya vienen limpios y modelados.
¿Cómo procesar grandes volúmenes y datos en tiempo real?
No todos los datos llegan ordenados ni en lotes. A veces necesitas procesar terabytes históricos y otras veces analizar eventos al segundo. AWS tiene un servicio para cada escenario.
¿Qué es EMR y qué herramientas open source soporta?
EMR significa Elastic MapReduce y es la plataforma de AWS para procesar grandes volúmenes de información usando frameworks de código abierto. Soporta:
- Hadoop.
- HBase.
- Spark.
- Otros motores del ecosistema big data.
Lo usas cuando tienes cargas pesadas de procesamiento distribuido y quieres aprovechar herramientas que ya conoces del mundo open source, sin tener que administrar el clúster manualmente.
¿Qué hace Kinesis con datos en tiempo real?
Kinesis te permite hacer ingesta y análisis de datos en tiempo real sobre grandes volúmenes de información. Piensa en clics de una app, telemetría de dispositivos IoT o transacciones financieras que necesitas leer al instante.
Dentro de Kinesis hay varios subtipos que verás más adelante, cada uno con un propósito distinto. Toma nota de este servicio porque suele aparecer en preguntas de certificación.
¿Cuándo uso Kinesis y cuándo EMR? Kinesis para streaming en tiempo real; EMR para procesamiento por lotes de datos históricos.
¿Cómo construir un data lake con Lake Formation?
Lake Formation simplifica la creación y gestión de un lago de datos. Por debajo usa S3 como capa de almacenamiento, así que aprovechas su durabilidad y costo bajo, pero le sumas controles de acceso, catalogación y permisos centralizados.
Es la opción cuando quieres consolidar fuentes diversas (bases de datos, archivos, streams) en un solo lugar gobernado.
¿Qué otros servicios de datos ofrece AWS?
El catálogo no termina ahí. También existen OpenSearch para búsqueda y análisis de logs, y QuickSight para visualización tipo Business Intelligence. Cada uno cubre una capa distinta del flujo de datos, desde la ingesta hasta el dashboard final.
La idea no es memorizar todos los servicios, sino entender qué problema resuelve cada uno y cómo se conectan entre sí. ¿Cuál de estos servicios crees que usarías primero en tu proyecto actual? Cuéntame en los comentarios.