Bienvenida e introducción al curso

1

Big Data en la Nube: Análisis, Transformación y Seguridad

2

Transformación de Datos en Cloud: Automatización y Seguridad

3

Big Data en la Nube: Escalabilidad, Automatización y Eficiencia

4

Almacenamiento y Procesamiento de Datos en la Nube

5

Comparativa de AWS y GCP para proyectos BigData

Arquitecturas

6

Arquitectura Lambda para Procesamiento de Datos en la Nube

7

Arquitectura Capa: Procesamiento de Datos en Tiempo Real

8

Arquitectura Batch: Procesamiento de Datos Histórico en la Nube

Extracción de información

9

Extracción de Datos a la Nube: Estrategias y Herramientas

10

Uso de Python y AWS Cloud9 para Proyectos de Big Data

11

Uso de Boto3 para Servicios AWS en Python

12

Integración de AWS API Gateway en Proyectos de Big Data

13

Uso de Storage Gateway para Integración de Datos en la Nube

14

Procesamiento de Datos en Tiempo Real con AWS Kinesis Data Stream

15

Creación de Kinesis Data Streams en AWS

16

Despliegue de Kinesis con AWS CloudFormation

17

Entrega y Transformación de Datos con Kinesis Firehose en AWS

18

Configuración de Kinesis Firehose en AWS paso a paso

19

Configuración Básica de Amazon Kinesis Firehose en AWS

20

AWS MSK: Implementación y Gestión de Apache Kafka en la Nube

21

Despliegue de Clúster MSK en AWS paso a paso

Transformación de Información

22

Transformación de Datos con AWS Glue: ETL y Catálogo de Metadatos

23

Instalación y Configuración de Apache Zeppelin para AWS Glue

24

Configuración de Developer Endpoint en AWS Glue para Apache Zeppelin

25

Conexión y configuración de Apache Zeppelin para ETL en AWS

26

Creación de un ETL con AWS Glue: Crawlers y Catalogación de Datos

27

Configuración y Ejecución de ETL en AWS Glue paso a paso

28

Creación y Ejecución de ETL con AWS Glue y S3

29

Procesamiento de Datos con EMR en AWS

30

Creación de un clúster EMR en AWS paso a paso

31

Conexión y Configuración de Zeppelin en Clúster EMR

32

Automatización de Clústeres EMR con Plantillas de CloudFormation

33

AWS Lambda en Proyectos de Big Data en Tiempo Real

34

Uso de Lambda en Arquitecturas de Big Data Real Time y Batch

35

Configuración de Funciones Lambda para Big Data en AWS

Carga de Información

36

Consultas SQL en Big Data con AWS Athena y S3

37

Consultas SQL en S3 con AWS Athena y Glue Catalog

38

AWS Redshift: Almacenamiento y Análisis de Datos Masivos

39

Configuración de Amazon Redshift en AWS paso a paso

40

Lake Formation: Automatización y Seguridad en Gestión de Data Lakes

Consumo de información

41

Implementación de Elasticsearch en AWS: Búsqueda y Visualización

42

Despliegue de Clúster Elasticsearch en AWS Paso a Paso

43

Visualización de Datos con Kibana y Elasticsearch en AWS

44

Visualización de Datos en AWS con QuickSight

45

Habilitación y uso de QuickSight en AWS

Seguridad, Orquestación y Automatización

46

Seguridad en Big Data con AWS: Cifrado, Permisos y Monitoreo

47

Seguridad de Datos en AWS con Amazon Macie

48

Habilitación y Configuración de AWS Macie para Gestión de Datos Seguros

49

Orquestación de ETLs con Apache Airflow y Python en Big Data

50

Despliegue y Orquestación de Tareas con Google Cloud Composer

51

Arquitecturas de Big Data en Cloud: Batch y Tiempo Real

Clase pública

52

Fundamentos de Big Data: Volumen, Velocidad, Variedad, Veracidad y Valor

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Curso de Big Data en AWS

Curso de Big Data en AWS

Carlos Andrés Zambrano Barrera

Carlos Andrés Zambrano Barrera

Extracción de Datos a la Nube: Estrategias y Herramientas

9/52
Recursos

Existen distintas formas de conectar tu sistema en la nube con la fuente de origen de datos que necesitas, algunas opciones son:

  • Utilizar el SDK de la nube utilizando el lenguaje de programación de tu preferencia.
  • Usar el CLI para conectarse a la nube.
  • Utilizar servicios especializados para la tarea.

Es posible combinar esas opciones para llevar la información que necesites a tu cloud provider.

Aportes 10

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Existen diversas estrategias para conectar nuestro sistema en la nube con la fuente de origen de datos.

  • SDK: Podemos establecer una comunicación con todos los servicios en la nube a través de las SDKs. Aquí entran en juego los lenguajes de programación.
  • CLI: Los Cloud Providers cuentan con interfaces de líneas de comandos a través de las cuales podemos interactuar con los servicios en la nube.
  • Servicios: Aquí nos referimos a servicios especializados para realizar estas tareas (recibir/extraer información desde diferentes fuentes).

Podemos también combinar estas estrategias entre sí.

Estas clases se cortan!!! no tienen un cierre

Wow! Super brutal las diferentes opciones que podemos combinar para conectar nuestra data con la nube.

Existen distintas formas de conectar tu sistema en la nube con la fuente de origen de datos que necesitas, algunas opciones son:

Utilizar el SDK de la nube utilizando el lenguaje de programación de tu preferencia.
Usar el CLI para conectarse a la nube.
Utilizar servicios especializados para la tarea.

Migrar tu información a la nube (Cloud) implica trasladar datos, aplicaciones y cargas de trabajo desde infraestructuras locales a servicios en la nube proporcionados por empresas como AWS, Google Cloud o Azure. ### **Ventajas de mover tu información a la nube** ✅ **Escalabilidad**: Puedes aumentar o reducir recursos según la demanda. ✅ **Alta disponibilidad**: Accede a tus datos desde cualquier lugar con conexión a internet. ✅ **Seguridad**: La mayoría de los proveedores ofrecen cifrado y medidas de seguridad avanzadas. ✅ **Reducción de costos**: Evita gastos en hardware y mantenimiento. ### **Tipos de migración a la nube** ☁ **Lift and Shift**: Mover los datos y aplicaciones sin modificaciones. ☁ **Replataforming**: Adaptar aplicaciones para aprovechar mejor los servicios en la nube. ☁ **Refactoring**: Rediseñar aplicaciones para optimizar su desempeño en la nube. ### **Servicios clave en la nube para almacenar información** 📌 **Amazon S3**: Almacenamiento escalable y seguro. 📌 **Google Cloud Storage**: Almacén de objetos para cargas de trabajo empresariales. 📌 **Azure Blob Storage**: Solución de almacenamiento de Microsoft. 📌 **Bases de datos en la nube**: DynamoDB, Aurora, BigQuery, Firestore, entre otras. Si quieres más detalles sobre cómo migrar a la nube, dime qué tipo de datos o cargas de trabajo deseas mover. 🚀
De diez esta info, me esclarece la potencialidad

Es posible combinar esas opciones para llevar la información que necesites a tu cloud provider.

Formas de extraer datos hacia nuestra nube: SDK, CLI, Servicios

De los 2:21 mins no se corto nada. quiza ya fue arreglado-
interesante la informacion…

Hola Prof, que capa de servicio hay en Azure para llevar los datos. Saludos. Gracias