Aprende a manejar grandes volúmenes de datos con Apache Spark. Crea procesos ETL, trabaja con RDDs y DataFrames, optimiza consultas y aprende sobre la persistencia y particionado para mejorar el rendimiento en Big Data.
Configuración
Operaciones RDDs
- 7
Transformaciones y Acciones en RDD de Spark
02:32 min - 8

Transformaciones y acciones
11:27 min - 9

Interacción con RDDs en Spark: Operaciones Básicas y Avanzadas
14:35 min - 10

Operaciones avanzadas con RDDs en Spark: Uniones y Joins
14:13 min - 11

Unión de Datos en RDD para Deportistas Olímpicos
03:09 min - 12

Operaciones Numéricas con RDDs en Juegos Olímpicos
08:59 min
Data Frames y SQL
- 13

Creación y Gestión de Data Frames en PySpark
14:09 min - 14

Creación de DataFrame desde RDD en PySpark
09:15 min - 15

Manipulación de Data Frames en PySpark
12:32 min - 16

Joins y Selección de Datos en DataFrames con PySpark
09:34 min - 17

Filtrado y Join de Datos Olímpicos en Pandas
05:02 min - 18

Funciones de Agregación en Spark para DataFrames
10:00 min - 19

Uso de SQLContext para Registro y Consultas con DataFrames en Spark
07:29 min - 20
Creación y Uso de Funciones UDF en Spark
01:06 min - 21

Creación y uso de UDFs en PySpark para manejo de datos faltantes
13:09 min
Persistencia y particionado
Conclusiones
Conoce quién enseña el curso

Proyecto del curso

Manipula un amplio volumen de datos de los Juegos Olímpicos
Te encargarás de limpiar, procesar y filtrar los datos registrados durante décadas en los Juegos Olímpicos para obtener información clara de los mismos gracias al poder de Spark.
Ver proyectosoftware y recursos necesarios
- Terminal y línea de comandos.
- Jupyter.
4.3 · 279 opiniones


Enzo Rafael Cárdenas Nicho
Un curso algo dificil de entender, pero con conocimiento previo entenderlo es sencillo, creo que el profesor podría se más cuidadoso con los conceptos que brinda, asimismo el detalle de lo que menciona, pero finalmente pude aprender.


EL curso es bueno, te lleva mediante los elementos básicos de Spark y las mejores prácticas, el profesor tiene algunos errores durante el curso pero es muy bueno

Angel Granados
Ecelente profe, me gustaría que explicara con más detalle pero entienco la complejidad del Lenguaje y su instalacion dado que al instalarlo me costo. Pediria una actualizacion del curso.


FELIX DAVID CORDOVA GARCIA
deberia de actualizarse


Francisco Javier Guerrero Amador
Excelente


Daniel da Silva Jarque
Gracias al profesor, por este excelente curso y a los compañeros, por sus aportaciones.


Frank Gonzalez
Casi que no.


Ruben Dario Troche Piñanez
Muy bueno y muy interesante el curso. Gracias Totales Profesor y Platzi por agregarme valor.


Nicolas David Sepulveda Alvear
excelente contenido muy buen curso, oportunidad de mejora hacer menos tediosa el tema de la instalacion y colocar el paso a paso como se ha hecho en otros cursos

Jose Arnulfo Gonzalez Torres
EL DOCENTE EXPLICA MUY BIEN


Camilo Granda Gómez
Excelente. Claridad conceptual por parte del profesor y explicaciones claras, concisas y eficientes.

alejandro parodi
Excelente

Dayro Jiménez Guerra
Curso interesante que dota al aprendiz de las herramientas necesarias para comprender y utilizar Spark.


Edwin Paez Guerrero
Es muy buen curso para entender los fundamentos de spark.


Alberto Gurrion
Excelente curso


Byron Boada
Es un curso muy útil para iniciar con spark

Evelia Lopez Rueda
Curso muy bueno. Pero seria interesante que se actualizara


Servando Hernández Camargo
Buen desarrollo del curso excelente forma de transmitir sus conocimientos


Eduard Arias
Excelente introducción a Spark. Me dejó información valiosa de una herramienta potente y de ejecución paralela para la transformación de grandes cantidades de datos.


Giraluna Gómez
super


Jhon Eduard Montes Lancheros
Saber qué es Spark

Jorge Alberto Luna Lopez
Vi quejas de lo avanzado y complejo del curso me parece que para llegar a el ya debes conocer SQL y python intermedio, en lo personal llevo años trabajando con SQL y programando en otros lenguajes ademas de ambientes Linux, todo me funciono excelente, recomiendo mucho este curso para empezar con Spark, espero haya nuevos cursos mas avanzados.

José Martínez Santana
El curso fue bastante dificil porque la versión y lo que conlleva la instalación está desactualizada, me tomó varios días poder echar andar Spark. El resto del curso me pareció muy interesante las capacidades de Spark.


Fernando Garcia de la Cruz
Muy buena introducción a Spark se me han aclarado muchas cosas, el profesor lo hizo ameno.


Excelente curso! Muy bien explicado.


Don Alfredo Fuentes Araque
Muy buen curso para tener unos buenos fundamentos en el uso de apache spark. El profesor explica de una forma muy clara.


Kevin Alexis Padilla Lopez
Muy buen curso. Por que no habia una explicacion de como instalar en windows, casi dejo el curso pero mas bien pude usar un colab y pasar un excelente curso para grandes cantidades de data


Juan Sebastian Pastrana Ardila
Excelente curso de Spark, tiene algunos fallos que en la sección de comunidad fueron corregidos


Jhoan Felipe Montoya Uran
Aprender la relacion con hadoop y hacer ambientes virtuales de trabajo para para crear y transformar RDD

Garro Ladino Sergio Ezequiel
me encanto el curso, excelente profesor
Este curso es parte de estas rutas de aprendizaje
La comunidad es nuestro super poder
Contenido adicional creado por la comunidad que nunca para de aprender



