Aprende a manejar grandes volúmenes de datos con Apache Spark. Crea procesos ETL, trabaja con RDDs y DataFrames, optimiza consultas y aprende sobre la persistencia y particionado para mejorar el rendimiento en Big Data.
Configuración
Operaciones RDDs
- 7
Transformaciones y Acciones en RDD de Spark
02:32 min - 8

Transformaciones y acciones
11:27 min - 9

Interacción con RDDs en Spark: Operaciones Básicas y Avanzadas
14:35 min - 10

Operaciones avanzadas con RDDs en Spark: Uniones y Joins
14:13 min - 11

Unión de Datos en RDD para Deportistas Olímpicos
03:09 min - 12

Operaciones Numéricas con RDDs en Juegos Olímpicos
08:59 min
Data Frames y SQL
- 13

Creación y Gestión de Data Frames en PySpark
14:09 min - 14

Creación de DataFrame desde RDD en PySpark
09:15 min - 15

Manipulación de Data Frames en PySpark
12:32 min - 16

Joins y Selección de Datos en DataFrames con PySpark
09:34 min - 17

Filtrado y Join de Datos Olímpicos en Pandas
05:02 min - 18

Funciones de Agregación en Spark para DataFrames
10:00 min - 19

Uso de SQLContext para Registro y Consultas con DataFrames en Spark
07:29 min - 20
Creación y Uso de Funciones UDF en Spark
01:06 min - 21

Creación y uso de UDFs en PySpark para manejo de datos faltantes
13:09 min
Persistencia y particionado
Conclusiones
Conoce quién enseña el curso

Proyecto del curso

Manipula un amplio volumen de datos de los Juegos Olímpicos
Te encargarás de limpiar, procesar y filtrar los datos registrados durante décadas en los Juegos Olímpicos para obtener información clara de los mismos gracias al poder de Spark.
Ver proyectosoftware y recursos necesarios
- Terminal y línea de comandos.
- Jupyter.
4.3 · 279 opiniones


Enzo Rafael Cárdenas Nicho
Un curso algo dificil de entender, pero con conocimiento previo entenderlo es sencillo, creo que el profesor podría se más cuidadoso con los conceptos que brinda, asimismo el detalle de lo que menciona, pero finalmente pude aprender.


EL curso es bueno, te lleva mediante los elementos básicos de Spark y las mejores prácticas, el profesor tiene algunos errores durante el curso pero es muy bueno

Geovanny Quintero Velez
La configuración del entorno es sencilla de seguir. En otros tutoriales mi maquina no se adaptaba a los procedimientos.


La explicación fue clara con los ejemplos


es una buna base para complementar con estudio por su cuenta


José Luis Villarreal
Buen curso, seria bueno actualizarlo ya que se han agregado nuevas funcionalidades a spark


Mario Enrique Ascencio Garcia
Spark es una tecnologia no es ni una bd, ni muchomenos un framework


Nelson García
El curso es muy bueno como introduccióin a Spark y la documentación de Jupyter en el repositorio de Git esta genial
![Francisco Garcia [C6]](https://static.platzi.com/media/avatars/avatars/garciafran_c845c2fe-2ea4-42db-a305-a7f4ef13b0fd.jpeg)

Francisco Garcia [C6]
Excelente curso, me gusto mucho, me gustaría que también hubiera de hadoop, y poder hacer un ejercicio completo. Gracias


Diego Fernando Cardona Pineda
Los diferentes ejemplos y la mezcla con conceptos teóricos.

Andres Hita
La práctica permite el afianzamiento de lo aprendido de manera conceptual


Jose Miguel Baltazar Avelino
Excelente curso


Johan Sebastian Valero Mariño
todo el contenido fue interesante.


Probablemente el mejor cUrso y el mejoR profesor de todA esta plataforMa, Incluye excElentes pRacticas y teorias. EntenDí todo sobre spArk!


Camilo Granda Gómez
Excelente. Claridad conceptual por parte del profesor y explicaciones claras, concisas y eficientes.


Jonathan Villavicencio Gonzalez
Se acerca mucho a la forma de trabajo en la realidad, espectacular <3

Carlos Mauro Cárdenas Fernández
:)


Adrian Camilo Diaz Barreto
Excelente contenido para findamentos de spark


Guillermo Medinilla
Excelente curso de Fundamentos de Spark para Big Data


Jesus Andres Camargo Payanene
muy bueno, deberia haber una continuación

Dayro Jiménez Guerra
Curso interesante que dota al aprendiz de las herramientas necesarias para comprender y utilizar Spark.


Edwin Paez Guerrero
Es muy buen curso para entender los fundamentos de spark.


José David Bojórquez Chatham
Muy completo para conocer la herramienta desde 0


Byron Boada
Es un curso muy útil para iniciar con spark


Williams Juniors Martínez Pérez
ojala saquen un curso de apache spark mas avanzado y actualizado con versiones mas nuevas, y como hacer pipelines de datos

Evelia Lopez Rueda
Curso muy bueno. Pero seria interesante que se actualizara


Eduard Arias
Excelente introducción a Spark. Me dejó información valiosa de una herramienta potente y de ejecución paralela para la transformación de grandes cantidades de datos.


Giraluna Gómez
super


David Manero Millán
Interesante, queda trabajar más lo conceptos para


victor palomino
Realizar ejercicios para mejor comprensión del tema
Este curso es parte de estas rutas de aprendizaje
La comunidad es nuestro super poder
Contenido adicional creado por la comunidad que nunca para de aprender



