No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Curso de Hadoop

Curso de Hadoop

Benjamín Casazza

Benjamín Casazza

Reconocer y diseñar flujo de datos

8/22
Recursos

Aportes 7

Preguntas 2

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

Para los que estén tan perdidos como yo lo estuve, Cloudera CDH es una extensión de Hadoop que facilita mucho el uso y administración de esta plataforma. En este caso se crea todo un clúster Hadoop con todas las herramientas y servicios habilitados.

La ejecución de comandos que aquí se muestra (al menos la mayoría de argumentos) se puede ver desde la imagen de Cloudera (cloudera/quickstart) de DockerHub para entender mejor cada uno: https://hub.docker.com/r/cloudera/quickstart

La última porción, /usr/bin/docker-quickstart, ejecuta todos los servicios

Hive es un servicio de Bodega de Datos (Data Warehouse) y en su directorio estaremos almacenando todo lo que hay en la base de datos de prueba MySql importada mediante la utilidad de ingesta de datos Sqoop

Esto es según lo que estoy entendiendo. Correcciones y complementos son bienvenidos.

Honestamente, no se entiende el objetivo de la clase, por qué de repente ya tenemos cloudera?, por qué invalidar la metadata?, por qué de repente estamos haciendo queries en HUE?, qué es HUE?. Entiendo que en clases anteriores no se meta a detalle de Git / Docker, pero me parece que explicar el resto es necesario

bueno, en mi caso pasare primero el curso de docker y regreso

En caso falle el inicio de hue al iniciar la imagen de docker, incrementen la memoria de docker a 4gb.

Starting hue:                                              [FAILED]

cuando intento levantar el container me empieza a decargar un archi de 4.44 GB, eso es lo que debe pasar?, o es que hice algo mal?

¿Porque es buena practica invalidar la metadata?

¿Alguién más le sale el siguiente error?

docker: invalid reference format: repository name must be lowercase.
See 'docker run --help'.

El que le haya salido, por favor, ayuda.

Este es el comando que estoy intentando ejecutar:

sudo docker run --hostname=quickstart.cloudera --privileged=true -it -v $PWD:/src --publish-all=true -p 8888:8888 -p 8080:8080 -p 7180:7180 cloudera/quickstart /usr/bin/docker-quickstart