Aprende a manejar grandes volúmenes de datos con Apache Spark. Crea procesos ETL, trabaja con RDDs y DataFrames, optimiza consultas y aprende sobre la persistencia y particionado para mejorar el rendimiento en Big Data.
Configuración
Operaciones RDDs
- 7

Transformaciones y Acciones en RDD de Spark
02:32 min - 8

Transformaciones y acciones
11:27 min - 9

Interacción con RDDs en Spark: Operaciones Básicas y Avanzadas
14:34 min - 10

Operaciones avanzadas con RDDs en Spark: Uniones y Joins
14:13 min - 11

Unión de Datos en RDD para Deportistas Olímpicos
03:09 min - 12

Operaciones Numéricas con RDDs en Juegos Olímpicos
08:59 min
Data Frames y SQL
- 13

Creación y Gestión de Data Frames en PySpark
14:09 min - 14

Creación de DataFrame desde RDD en PySpark
09:14 min - 15

Manipulación de Data Frames en PySpark
12:32 min - 16

Joins y Selección de Datos en DataFrames con PySpark
09:34 min - 17

Filtrado y Join de Datos Olímpicos en Pandas
05:02 min - 18

Funciones de Agregación en Spark para DataFrames
10:00 min - 19

Uso de SQLContext para Registro y Consultas con DataFrames en Spark
07:29 min - 20

Creación y Uso de Funciones UDF en Spark
01:06 min - 21

Creación y uso de UDFs en PySpark para manejo de datos faltantes
13:08 min
Persistencia y particionado
Conclusiones
Conoce quién enseña el curso

Óscar Gutiérrez Castillo
4.3 · 288 opiniones


William Caleb Saenz Camacho
Me gusto mucho el curso, no había nunca programado en este software y me reto. se que falta conocer más a profundidad pero fue una buena introducción a spark


Nicolas Lozano Amaya
Tiene lo basico para iniciar en el mundo de procesamiento de datos a gran escala de forma distribuida. Me hubiera gustado que la sintaxis en python estubiera mas cercana a los PEPs. Recomendado.


Diego Armando Casillas Muñoz
Es un excelente curso introductorio a Spark. Me gustó el uso de pySpark y la forma tan clara en que se explican los conceptos más importantes de esta herramienta. Felicidades al profesor Oscar por este curso tan bueno.


Mario Alberto Vásquez Arias
Unas clases muy bien explicadas y un temario bastante completo para ser de fundamentos.
Este curso es parte de estas rutas de aprendizaje
La comunidad es nuestro super poder
Contenido adicional creado por la comunidad que nunca para de aprender



