Bienvenida e introducci贸n al curso

1

Iniciando con Big Data

2

Cloud Computing en proyectos de BigData

3

Introducci贸n al manejo de datos en Cloud

4

Datos en Cloud

5

驴Qu茅 nube deber铆a utilizar en mi proyecto de Big Data?

Arquitecturas

6

Arquitecturas Lambda

7

Arquitectura Kappa

8

Arquitectura Batch

Extracci贸n de informaci贸n

9

Llevar tu informaci贸n al cloud

10

Demo - Creando nuestro IDE en la nube con Python - Boto3

11

驴C贸mo usar Boto3?

12

API Gateway

13

Storage Gateway

14

Kinesis Data Streams

15

Configuraci贸n de Kinesis Data Streams

16

Demo - Despegando Kinesis con Cloudformation

17

Kinesis Firehose

18

Demo - Configuraci贸n de Kinesis Firehose

19

Reto - Configurando Kinesis Firehose

20

AWS - MSK

21

Demo - Despliegue de un cl煤ster con MSK

Transformaci贸n de Informaci贸n

22

AWS - Glue

23

Demo - Instalando Apache Zeppelin

24

Creaci贸n del Developer Endpoint

25

Demo - Conectando nuestro developer Endpoint a nuestro Zeppelin Edpoint

26

Demo - Creando nuestro primer ETL - Crawling

27

Demo - Creando nuestro primer ETL - Ejecuci贸n

28

Demo - Creando nuestro primer ETL - Carga

29

AWS - EMR

30

Demo - Desplegando nuestro primer cl煤ster con EMR

31

Demo - Conect谩ndonos a Apache Zeppelin en EMR

32

Demo- Despliegue autom谩tico de EMR con cloudformation

33

AWS - Lambda

34

Ejemplos AWS- Lambda

35

Demo - Creando una lambda para BigData

Carga de Informaci贸n

36

AWS - Athena

37

Demo - Consultando data con Athena

38

AWS - RedShift

39

Demo - Creando nuestro primer cl煤ster de RedShift

40

AWS - Lake Formation

Consumo de informaci贸n

41

AWS - ElasticSearch

42

Demo - Creando nuestro primer cl煤ster de ElasticSearch

43

AWS - Kibana

44

AWS - QuickSight

45

Demo - Visualizando nuestra data con QuickSight

Seguridad, Orquestaci贸n y Automatizaci贸n

46

Seguridad en los Datos

47

AWS Macie

48

Demo - Configurando AWS Macie

49

Apache Airflow

50

Demo - Creando nuestro primer cl煤ster en Cloud Composer

51

Arquitectura de referencia

Clase p煤blica

52

驴Qu茅 es Big Data?

A煤n no tienes acceso a esta clase

Crea una cuenta y contin煤a viendo este curso

Curso de Big Data en AWS

Curso de Big Data en AWS

Carlos Andr茅s Zambrano Barrera

Carlos Andr茅s Zambrano Barrera

AWS - Athena

36/52
Recursos

Es un servicio completamente administrado cuyas caracter铆sticas m谩s importantes son:

  • Podemos realizar consultas SQL a la data almacenada en S3.
  • Soporta diferentes formatos de archivo de informaci贸n.
  • Provee una integraci贸n nativa con otros servicios de AWS de almacenamiento como S3, RedShift, DynamoDB y Kinesis.
  • Podemos integrarlo con otras herramientas utilizando JDBC o ODBC.
  • Puedes almacenar las queries que realices y que m谩s utilices.

Aportes 7

Preguntas 0

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesi贸n.

Es un servicio completamente administrado cuyas caracter铆sticas m谩s importantes son:

Podemos realizar consultas SQL a la data almacenada en S3.
Soporta diferentes formatos de archivo de informaci贸n.
Provee una integraci贸n nativa con otros servicios de AWS de almacenamiento como S3, RedShift, DynamoDB y Kinesis.
Podemos integrarlo con otras herramientas utilizando JDBC o ODBC.
Puedes almacenar las queries que realices y que m谩s utilices.

AWS - Athena
Es un servicio completamente administrado cuyas caracter铆sticas m谩s importantes son:
鈥 Podemos realizar consultas SQL a la data almacenada en S3.
鈥 Soporta diferentes formatos de archivo de informaci贸n.
鈥 Provee una integraci贸n nativa con otros servicios de AWS de almacenamiento como S3, RedShift, DynamoDB y Kinesis.
鈥 Podemos integrarlo con otras herramientas utilizando JDBC o ODBC.
鈥 Puedes almacenar las queries que realices y que m谩s utilices.
鈥 Servicio de consultas interactivo para data en S3 utilizando SQL.
鈥 Es serverless, creado en presto y soporta diferentes formatos csv, json, parquet, ORC, tsv鈥)
鈥 Provee interacci贸n con otros servicios de AWS como S3, Redshift, DynamoDB y Kinesis.

JDBC / ODBC: Conexi贸n con herramientas usando JDBC ejemplo: SQL Workbench.
Queries: Consultas pueden ser guardadas para utilizar m谩s adelante.
Seguridad: Permisos granulares por base de datos y por tabla.

Amazon Athena is an interactive query service that makes it easy to analyze data in Amazon S3 using standard SQL. Athena is serverless, so there is no infrastructure to setup or manage, and you pay only for the queries you run. To get started, simply point to your data in S3, define the schema, and start querying using standard SQL.

Athena - unido a quicksight para visualizar toda los datos y las consultas

AWS - Athena
Es un servicio completamente administrado cuyas caracter铆sticas m谩s importantes son:
鈥 Podemos realizar consultas SQL a la data almacenada en S3.
鈥 Soporta diferentes formatos de archivo de informaci贸n.
鈥 Provee una integraci贸n nativa con otros servicios de AWS de almacenamiento como S3, RedShift, DynamoDB y Kinesis.
鈥 Podemos integrarlo con otras herramientas utilizando JDBC o ODBC.
鈥 Puedes almacenar las queries que realices y que m谩s utilices.
鈥 Servicio de consultas interactivo para data en S3 utilizando SQL.
鈥 Es serverless, creado en presto y soporta diferentes formatos csv, json, parquet, ORC, tsv鈥)
鈥 Provee interacci贸n con otros servicios de AWS como S3, Redshift, DynamoDB y Kinesis.

AWS Athena es un servicio de consultas completamente administrado.

Caracter铆sticas

  • Podemos tomar ventajas de realizar consultas SQL a trav茅s de Athena sobre la informaci贸n que est茅 almacenada en S3. Athena se conectar铆a a un Glue Catalog, el cual le indicar铆a d贸nde est谩 la informaci贸n almacenada en S3.
  • Es serverless; es decir, no tendremos cargas de administraci贸n o de creaci贸n de servidores para utilizar este servicio.
  • Podemos consultar diferentes tipos de archivos a trav茅s de SQL, como por ejemplo, csv, JSON, parquet, ORC, tsv, etc.
  • Este servicio provee una integraci贸n nativa con otros servicios de AWS como Glue, S3, RedShift, DynamoDB y Kinesis.
  • Tambi茅n podemos integrar este servicio haciendo uso de JDBC y ODBC con otras herramientas. Por ejemplo, podr铆amos trabajar con MySQL Workbrench, y a trav茅s de JDBC nos conectar铆amos a Athena para realizar consultas a la informaci贸n almacenada en S3.
  • Las consultas pueden ser guardadas para utilizarlas m谩s adelante.
  • En cuanto a seguridad, tenemos permisos granulares a nivel de bases de datos y de tablas.

Es as铆 como este servicio est谩 en una parte muy importante de la cadena de BigData.

Excelente!. En resumen es como tener un IDE (Integrated Development Environment) de consultas SQL pero como servicio.