Storage Gateway: puerta entre on-premise y S3

Clase 13 de 52 • Curso de Big Data en AWS

Resumen

¿Necesitas llevar datos y logs desde tu entorno on-premise a AWS sin fricción? Con AWS Storage Gateway puedes crear una puerta de enlace simple entre tu data center y la nube, enviando datos a Amazon S3 para habilitar transformación en tiempo real y procesamiento por lotes. Aquí verás cómo funciona y qué opciones de procesamiento activa para big data.

¿Qué es Storage Gateway y para qué se usa?

Storage Gateway ofrece una forma práctica de mandar información desde un data center on-premise a la nube. Es especialmente útil cuando una aplicación on-premise genera logs que quieres llevar a AWS para comenzar proyectos de transformación y visualización de datos.

Caso de uso clave: enviar logs de aplicaciones on-premise a AWS para análisis posterior.
Beneficio inmediato: datos centralizados en S3 para activar flujos de procesamiento.
Resultado: base sólida para procesamiento y tratamiento de datos según tus necesidades.

¿Cuándo enviar logs a AWS con Storage Gateway?

Cuando tu aplicación corre on-premise y quieres consolidar logs en S3.
Cuando necesitas automatizar la transformación con funciones y trabajos gestionados.
Cuando buscas escalar el procesamiento sin mover tu aplicación de on-premise.

¿Cómo se implementa Storage Gateway en un data center?

La implementación es directa: descargas una imagen, usualmente un archivo VMDK para VMware, la instalas como máquina virtual en tu data center y actúa como puente entre on-premise y nube.

Descarga de imagen: formato VMDK para VMware.
Despliegue local: máquina virtual que hace de puerta de enlace.
Envío de datos: conexión de la aplicación a través de NFS hacia Storage Gateway.
Destino en la nube: Storage Gateway manda todos los datos a Amazon S3.

¿Qué papel cumple NFS en la arquitectura?

Provee una conexión simple entre la aplicación on-premise y Storage Gateway.
Permite que los datos producidos por los usuarios fluyan hacia S3 sin cambios en la app.

¿Qué procesamiento en S3 habilita para big data?

Una vez en S3, puedes activar servicios para transformar y procesar la información. Esto habilita escenarios real time y batch con herramientas nativas de AWS.

¿Cómo activar Lambda para transformación en tiempo real?

Configura una función Lambda que se ejecute cada vez que llegue un objeto nuevo a S3.
Aplica transformaciones inmediatas para casos de tiempo real.

¿Qué opciones por lotes hay con EMR y Glue?

Cluster de EMR nocturno: toma datos de S3, los procesa y deja el resultado en otro bucket.
Job de Glue (ETL): extrae, transforma y carga datos desde S3 hacia otro origen de datos.

En síntesis, Storage Gateway es una alternativa directa para mandar logs desde on-premise hacia la nube y, con los datos en S3, habilitar Lambda, EMR y Glue para transformar y orquestar tus flujos de big data.

¿Tienes un entorno on-premise y quieres llevar tus logs a AWS con Storage Gateway? Cuéntame tu caso y qué procesamiento buscas activar en S3.

Erick Herrera

student•

On-premises: En las instalaciones / en local. Se refiere a la utilización de servidores y entornos informáticos propios de la empresa.

VM: Virtual machine / Máquina virtual.

VMDK: Virtual machine disk.

NFS: Network File System. Es un protocolo de nivel de aplicación. Posibilita que distintos sistemas conectados a una misma red accedan a ficheros remotos como si se tratara de locales.

Espero les sirva, como a mi 😄 Un abrazo!

Mario Alberto García Meza

teacher•

Eres el MPV

Juan David Cajamarca Acuña

student•

Storage Gateway tiene tres características importantes:

Nos permite enviar información desde nuestro DataCenter on-premise hacia la nube. Es únicamente en este caso en donde haremos uso de este servicio.
Se podrían enviar los logs de una aplicación que corra on-premise a S3 para ser procesados.
Funciona en una VM instalada en nuestro DataCenter, en donde nos sirve como una puerta de enlace entre el mundo on-premise y el mundo en la nube.

Diego Fernando Romero Romero

student•

Me parece que es muy general la información suministrada, y este tema es muy importante para la carga de datos a S3.

Darvin Orozco

student•

No tengo claro el ¿Por qué se deben enviar los logs de nuestra aplicación on-premise hacia s3 para procesarlos?

Jean Nuñez

student•

Esto es una buena practica, porque son los logs los que nos permite ver un comportamiento extraño y si una aplicacion es hackeada, cual tu crees que va a ser lo primero que busque un hacker; Exacto Los logs; al tenerlos lo va a modificar haciendo pensar que no fue hackeado, por lo tanto, hay que sacarlos de la aplicacion.

Darvin Orozco

student•

Wow! Muchísimas gracias por hacerme ver la importancia de los Logs. Gracias amigo @jeancarlosn

CESAR ENRIQUE MUCHA ORELLANO

student•

Considero que usaria Storage gateway cuando quiero llevar información de mi app onpremise a la nube, sin embargo cuando rindo el examen me indican que es incorrecto, me aclaran pfv?

Usuario anónimo

user•

Siempre me han parecido éstos cursos muy técnicos y complicados.. No se preocupan por hacer que la gente entienda realmente los términos y conceptos que dictan.. Pueden saber mucho de un tema pero veo q no tienen la pedagogía para llegar a la gente !! se supone q uno entra es a aprender no a enredarse con tecnicismos.. q obviamente los hay y los debe haber.. no estoy diciendo eso.. digo es q deberían de preocuparse más por "aterrizar bien el conocimiento a la gente común" para q realmente entienda ...

john ct

student•

no es asi, el explica muy bien los temas de esta tecnologia.este es el ultimo curso de la ruta de AWS, asi que si existen otros cursos donde le explican cada uno de los servicios que se usan en AWS. ir alas clases ya estan creadas solo es ir a consumir y aprender de los videos. adicional que aws tiene un gran documentacion por si existen dudas de cualquier indole.

slds

Alfredo Olmedo

student•

- AWS Data Sorage Gateway

- Amazon S3

- AWS Lambda

- AWS Glue

- Amazon EMR

AWS Storage Gateway: Es un servicio híbrido de almacenamiento que permite a las aplicaciones locales utilizar el almacenamiento en la nube de AWS de manera transparente. Actúa como un puente entre tus datos locales y la nube, facilitando la migración, copia de seguridad y recuperación de desastres.

Amazon S3 (Simple Storage Service): Es un servicio de almacenamiento en la nube altamente escalable y duradero que permite guardar y recuperar cualquier cantidad de datos desde cualquier parte del mundo. Es ideal para copias de seguridad, archivado y almacenamiento de datos estáticos.

AWS Lambda: Es un servicio de computación sin servidores que permite ejecutar código en respuesta a eventos sin necesidad de aprovisionar o gestionar servidores. Solo pagas por el tiempo de ejecución de tu código, lo que facilita la creación de aplicaciones y servicios altamente escalables y eficientes en costos.

AWS Glue: Es un servicio de integración de datos totalmente administrado que facilita la preparación y carga de datos para análisis. AWS Glue puede descubrir, catalogar, limpiar, enriquecer y mover datos entre diferentes fuentes de manera automatizada.

Amazon EMR (Elastic MapReduce): Es un servicio administrado que facilita el procesamiento de grandes cantidades de datos utilizando marcos de procesamiento como Apache Hadoop, Spark y Presto. Es ideal para análisis de datos, aprendizaje automático, transformaciones de datos y procesamiento de datos de grandes volúmenes.

Jose Suarez

student•

Network File System, o NFS, es un protocolo de nivel de aplicación, según el Modelo OSI. Es utilizado para sistemas de archivos distribuido en un entorno de red de computadoras de área local. Posibilita que distintos sistemas conectados a una misma red accedan a ficheros remotos como si se tratara de locale

Usuario anónimo

user•

Tiene tres características importantes:

Nos permite enviar información desde nuestro datacenter on-premise a la nube. Puedes enviar los logs de una aplicación on-premise para que sean procesados. Funciona en una máquina virtual que instalamos en nuestro datacenter.

john ct

student•

storage gateway: mandar la informacion desde el datacenter on premise/company hacia el cloud

john ct

student•

Datacenter ! ! ! NFS
! ! ! ! AWS storage Gateway---- AWS S3— > AWS Glue,AWS EMR, Lambda

Usuario anónimo

user•

Interesante esta clase porque se entiende un poco mejor porque no solo esta la palabra storage

Usuario anónimo

user•

Bastante por aprender

Usuario anónimo

user•

util

Usuario anónimo

user•

gracias..

Usuario anónimo

user•

Storage Gateway nos sirve para subir nuestra data a la nube

LUIS GERARDO CAMBAL BARAHONA

student•

Storage Gateway envía datos desde on-premise hacia la nube

Usuario anónimo

user•

Ivan Acosta

student•

Si lugar a dudas Storage Gateway es un puente que conecta al Cloud con aplicaciones Onprem que muchas veces son aplicaciones Inhouse o legadas, pero estos orígenes de datos son importante para la toma decisiones.

Storage Gateway: puerta entre on-premise y S3

Bienvenida e introducción al curso

Big Data en la Nube: Análisis, Transformación y Seguridad

Big Data en Cloud desde origen a visualización

Por qué big data en cloud es más eficiente

Extracción vs ingesta en proyectos big data

Comparativa de AWS y GCP para proyectos BigData

Arquitecturas

Arquitectura Lambda: 3 capas para datos en tiempo real

Arquitectura capa: el tiempo real como ventaja

Cómo funciona la arquitectura batch

Extracción de información

Cómo mover datos a cloud con SDK y CLI

Python y boto3 para listar buckets S3

Boto3: inicializar clients de AWS en Python

API Gateway como puerta de big data