Aprende a manejar grandes volúmenes de datos con Apache Spark. Crea procesos ETL, trabaja con RDDs y DataFrames, optimiza consultas y aprende sobre la persistencia y particionado para mejorar el rendimiento en Big Data.
Configuración
Operaciones RDDs
- 7

Transformaciones y Acciones en RDD de Spark
02:32 min - 8

Transformaciones y acciones
11:27 min - 9

Interacción con RDDs en Spark: Operaciones Básicas y Avanzadas
14:34 min - 10

Operaciones avanzadas con RDDs en Spark: Uniones y Joins
14:13 min - 11

Unión de Datos en RDD para Deportistas Olímpicos
03:09 min - 12

Operaciones Numéricas con RDDs en Juegos Olímpicos
08:59 min
Data Frames y SQL
- 13

Creación y Gestión de Data Frames en PySpark
14:09 min - 14

Creación de DataFrame desde RDD en PySpark
09:14 min - 15

Manipulación de Data Frames en PySpark
12:32 min - 16

Joins y Selección de Datos en DataFrames con PySpark
09:34 min - 17

Filtrado y Join de Datos Olímpicos en Pandas
05:02 min - 18

Funciones de Agregación en Spark para DataFrames
10:00 min - 19

Uso de SQLContext para Registro y Consultas con DataFrames en Spark
07:29 min - 20

Creación y Uso de Funciones UDF en Spark
01:06 min - 21

Creación y uso de UDFs en PySpark para manejo de datos faltantes
13:08 min
Persistencia y particionado
Conclusiones
Conoce quién enseña el curso

Óscar Gutiérrez Castillo
4.3 · 293 opiniones


Héctor Germán Gil Novoa
Excelente .........................................................................................................................................................................................................


Don Alfredo Fuentes Araque
Muy buen curso para tener unos buenos fundamentos en el uso de apache spark. El profesor explica de una forma muy clara.

Camilo Monares
Excelente curso!!! Tiene todos los elementos y material para entender este temas tan complejo

Jonathan Heredia Arroyo
No hago mucho uso de Spark en mis labores sin embargo es una buena herramienta.
Este curso es parte de estas rutas de aprendizaje
La comunidad es nuestro super poder
Contenido adicional creado por la comunidad que nunca para de aprender



