API Gateway como puerta de big data

Clase 12 de 52 • Curso de Big Data en AWS

Resumen

Pensado para proyectos de big data, API Gateway de AWS actúa como puerta de enlace entre tus fuentes de datos y la nube. Soporta miles y cientos de miles de llamadas recurrentes y ayuda a prevenir ataques de denegación de servicio, habilitando flujos de ingesta que conectan productores como Zendesk, dashboards o IoT con servicios analíticos y de almacenamiento como Kinesis o S3.

¿Qué es API Gateway en big data y por qué importa?

Este servicio funciona como una front door: recibe eventos de múltiples productores y los enruta hacia los servicios adecuados en AWS. Es el intermediario entre “donde está la data” y “donde se procesa” dentro del ecosistema de AWS.

Soporta grandes volúmenes: miles y cientos de miles de llamadas recurrentes.
Ayuda a prevenir ataques de denegación de servicio.
Puede manejar caché para respuestas frecuentes.
Registra todo en los logs para auditoría y monitoreo.
Habilita servicios posteriores de cómputo, datos y visualización.

¿Cómo se construye el flujo de datos con API Gateway y Lambda?

Un escenario práctico: un sistema de tickets como Zendesk o GLPI envía casos vía operación put a API Gateway. Este, a su vez, dispara una función Lambda que procesa el evento y lo integra con servicios de datos en AWS.

Productor de información: plataforma de tickets que genera casos.
Envío al gateway: operación put hacia API Gateway.
Orquestación: API Gateway lanza una función Lambda.
Procesamiento: la función usa Python o cualquier SDK para interactuar con servicios de información.
Resultado: almacenar, transformar o alimentar una plataforma de visualización como Kibana.

¿Qué servicios puede alimentar la función lambda?

Kinesis para procesamiento de datos en streaming.
S3 para almacenamiento de objetos.
EMR para procesamiento con frameworks de datos.
Instancias de EC2 para cargas específicas.
Base de datos no relacional DynamoDB para consultas rápidas.
Visualización con Kibana como destino del flujo.

¿Qué habilidades y conceptos se aplican en este flujo?

Diseño de ingesta de información escalable.
Enrutamiento mediante una puerta de enlace confiable.
Prevención de denegación de servicio en el borde.
Orquestación con funciones Lambda.
Integración con servicios de datos usando SDK y Python.
Uso de caché y logs para eficiencia y trazabilidad.

¿Qué entradas y salidas admite para extraer información?

En el “lado izquierdo” se agrupan los productores de información: es decir, todo lo que genera eventos que deben llegar a AWS. En el “lado derecho”, API Gateway despliega o dispara servicios que ejecutan el procesamiento, guardan datos y dejan trazas.

¿Qué productores de información se conectan?

Dashboards con envío de eventos.
Aplicaciones móviles con llamadas recurrentes.
Dispositivos IoT con telemetría.
Aplicaciones también on-premise que exponen APIs.

¿Qué servicios se disparan y registran?

Funciones Lambda para lógica sin servidor.
Instancias EC2 para cómputo administrado.
Kinesis para procesamiento de datos.
DynamoDB como base de datos no relacional.
Manejo de caché para acelerar respuestas.
Logs completos para seguimiento operativo.

¿Te gustaría comentar un caso de uso o productor específico para mapearlo con API Gateway y Lambda? Comparte tus preguntas o contexto y continuamos la conversación.

Jose Colmenares

student•

¿Como funciona API Gateway? (un ejemplo)

Supongamos que tiene un sistema de gestion de tickets y quieres procesar todos esos casos para extraer conclusiones que te permitan brindar un mejor servicio
Puedes configurar para que todos esos ticket, a través de una operación PUT, se envien al API Gateway
El API Gateway va a ser capaz de tomarlo y enviarlos a una función Lambda
La función Lambda tiene la capacidad de interactuar, utilizando Python (o cualquier SDK), con cualquiera de los servicios de información que tenemos en adelante (en AWS)

Sergio Berrospi

student•

No puedo evitar ver el logo de Half-Life

Jaime Figueroa

student•

Gracias, ahora no lo puedo dejar de ver

Juan David Cajamarca Acuña

student•

Dentro de los servicios de extracción de información que tenemos en AWS, tenemos API Gateway, pero esta vez desde el punto de vista de BigData.

Este servicio nos sirve como nuestro "front door", es decir, la puerta de enlace entre la información y nuestra plataforma de nube.

Características de API Gateway

Soporta ciento de miles de llamadas recurrentes.
Cuenta con una funcionalidad que nos ayuda a prevenir ataques de DDoS y exponer nuestras aplicaciones.

Darvin Orozco

student•

Excelente clase, resumida y directa para entender la arquitectura del API Gateway, que es la puerta frontal entre la data exterior y el mundo de los servicios que ofrece AWS (ésto con la ayuda del lenguaje Python).

Usuario anónimo

user•

Este servicio nos va a servir como puerta de enlace entre la data que tenemos y la plataforma en la nube.

Soporta cientos de miles de llamadas concurrentes. Previene ataques DDOS.

Alberto Gurrion

student•

Pensando en un escenario de ingestio telemática ¿Cuál es la intencion de poner un api-gateway (tiene que ver con implementar cross cutting concerns como seguridad ?) y no directamente mandar información desde dispositivos telemáticos a Kinesis? ¿Es posible implementar seguridad sin necesidad del api gateway para que cada dispositivo se autentifique ?

Mario Alexander Vargas Celis

student•

AWS API Gateway: Introducción y Características 🚀

Amazon API Gateway es un servicio totalmente administrado de AWS que permite a los desarrolladores crear, publicar, mantener, monitorear y asegurar APIs en cualquier escala. Se utiliza para conectar clientes con servicios backend como Lambda, EC2, DynamoDB o cualquier otro servicio HTTP/HTTPS.

🔹 Características Principales

Soporte para diferentes tipos de APIs
- RESTful APIs
- WebSocket APIs
- HTTP APIs (más ligeras y económicas que REST)
Escalabilidad Automática
- Maneja millones de solicitudes sin intervención manual.
Autenticación y Autorización
- Compatible con IAM, Cognito y Lambda Authorizers.
Gestión de tráfico y seguridad
- Soporta rate limiting y protección contra ataques DDoS.
Monitoreo y Logging
- Integración con CloudWatch para logs, métricas y alertas.
Transformación de datos
- Permite mapear, modificar y validar peticiones/respuestas.
Integración con múltiples backends
- AWS Lambda, EC2, S3, DynamoDB, servicios HTTP, etc.

🔹 Casos de Uso 📌

✅ Creación de microservicios ✅ API Gateway para aplicaciones móviles/web ✅ Integración con AWS Lambda para una arquitectura serverless ✅ Exposición segura de endpoints para terceros ✅ Proxy para servicios internos de AWS

🔹 Ejemplo: Creando un API Gateway con Lambda

1️⃣ Crear una función Lambda en AWS Lambda 2️⃣ Configurar API Gateway para que llame a la función Lambda 3️⃣ Implementar una política de seguridad (IAM o Cognito) 4️⃣ Probar la API con Postman o cURL

🔹 Ejemplo en Python (Lambda)

import json

def lambda_handler(event, context): return { "statusCode": 200, "body": json.dumps({"message": "¡Hola desde AWS Lambda con API Gateway!"}) }

Con API Gateway puedes convertir cualquier servicio backend en una API escalable y segura. 🚀

Jose Suarez

student•

API Gateway es la puerta frontal entre la data exterior y el mundo de los servicios que ofrece AWS (esto con la ayuda del lenguaje Python). API Gateway utiliza las funciones Lambda en AWS para interacturar con los demás servicios.

Juan Pedro Emilio Lipari

student•

¿Se podría usar api gateway como puerta de una pagina web? ¿o no sería una buena práctica?

Diego Forero

Team Platzi•

No es la forma correcta de usarlo, para un sitio web puedes tener un loadbalancer y una o varias instancias ec2.

Usuario anónimo

user•

API Gateway es una especie de fireware jajaja. Es la puerta frontal para alimentar los otros servicios del cloud

Usuario anónimo

user•

Interesante

Usuario anónimo

user•

genial

Usuario anónimo

user•

API Gateway utiliza las funciones Lambda en AWS para interacturar con los demás servicios.

Usuario anónimo

user•

gracias

LUIS GERARDO CAMBAL BARAHONA

student•

API Gateway es la puerta frontal donde se recibe la data para alimentar otros servicios dentro de nuestra nube AWS

Usuario anónimo

user•

Bien.

john ct

student•

API gateway: puerta de enlace e intermediario entre lo exterior y lo interior.

john ct

student•

Amazon API Gateway enables you to create and deploy your own REST and WebSocket APIs at any scale. You can create robust, secure, and scalable APIs that access AWS or other web services, as well as data that’s stored in the AWS Cloud. You can create APIs to use in your own client applications, or you can make your APIs available to third-party app developers.

john ct

student•

API Gateway como puerta de big data

Bienvenida e introducción al curso

Big Data en la Nube: Análisis, Transformación y Seguridad

Big Data en Cloud desde origen a visualización

Por qué big data en cloud es más eficiente

Extracción vs ingesta en proyectos big data

Comparativa de AWS y GCP para proyectos BigData

Arquitecturas

Arquitectura Lambda: 3 capas para datos en tiempo real

Arquitectura capa: el tiempo real como ventaja

Cómo funciona la arquitectura batch

Extracción de información

Cómo mover datos a cloud con SDK y CLI

Python y boto3 para listar buckets S3

Boto3: inicializar clients de AWS en Python

API Gateway como puerta de big data

Storage Gateway: puerta entre on-premise y S3

AWS Kinesis: streaming masivo de datos

Cómo crear Kinesis Data Stream en AWS

Despliegue automatizado de Kinesis con CloudFormation

Cómo Kinesis Firehose entrega datos en tiempo real

Configuración de Kinesis Firehose en AWS

Configuración Básica de Amazon Kinesis Firehose en AWS

MSK vs Kinesis: cuál elegir en AWS

Creación de clúster AWS MSK desde la consola

Transformación de Información

Cómo AWS Glue transforma datos en la nube

Instalación de Apache Zeppelin paso a paso

Configurar developer endpoint de AWS Glue con Zeppelin

Conexión de Apache Zeppelin con AWS

Configurar AWS Glue Crawler para poblar catálogo

Configuración de Developer Endpoint en AWS Glue

Cómo configurar AWS Glue ETL desde S3 a Parquet

Qué es EMR y cuándo usarlo

Crear tu primer cluster de AWS EMR

Conectar Apache Zeppelin a EMR

EMR automatizado con CloudFormation

AWS Lambda para proyectos de big data

Lambdas en big data: real time y batch

Configuración de AWS Lambda para Big Data

Carga de Información

Cómo Athena consulta datos en S3 con SQL

Cómo funciona AWS Athena con S3

Redshift vs Athena: cuándo usar cada uno

Configuración de cluster Redshift en AWS

AWS Lake Formation automatiza tu data lake

Consumo de información

Cómo dimensionar shards de Elasticsearch en AWS

Cómo crear un clúster Elasticsearch en AWS

Cómo funciona Kibana con Elasticsearch

QuickSight: el BI en cloud de AWS

Configuración completa de QuickSight en AWS

Seguridad, Orquestación y Automatización

5 reglas de seguridad para Big Data en AWS

Cómo AWS Macie protege datos en S3

Configuración de AWS Macie en 5 pasos

Apache Airflow vs Step Functions para ETL

Despliegue de Apache Airflow en GCP

Arquitecturas batch y streaming en AWS

Clase pública

Las cinco B de big data explicadas