Aprende a manejar grandes volúmenes de datos con Apache Spark. Crea procesos ETL, trabaja con RDDs y DataFrames, optimiza consultas y aprende sobre la persistencia y particionado para mejorar el rendimiento en Big Data.
Configuración
Operaciones RDDs
- 7
Transformaciones y Acciones en RDD de Spark
02:32 min - 8

Transformaciones y acciones
11:27 min - 9

Interacción con RDDs en Spark: Operaciones Básicas y Avanzadas
14:35 min - 10

Operaciones avanzadas con RDDs en Spark: Uniones y Joins
14:13 min - 11

Unión de Datos en RDD para Deportistas Olímpicos
03:09 min - 12

Operaciones Numéricas con RDDs en Juegos Olímpicos
08:59 min
Data Frames y SQL
- 13

Creación y Gestión de Data Frames en PySpark
14:09 min - 14

Creación de DataFrame desde RDD en PySpark
09:15 min - 15

Manipulación de Data Frames en PySpark
12:32 min - 16

Joins y Selección de Datos en DataFrames con PySpark
09:34 min - 17

Filtrado y Join de Datos Olímpicos en Pandas
05:02 min - 18

Funciones de Agregación en Spark para DataFrames
10:00 min - 19

Uso de SQLContext para Registro y Consultas con DataFrames en Spark
07:29 min - 20
Creación y Uso de Funciones UDF en Spark
01:06 min - 21

Creación y uso de UDFs en PySpark para manejo de datos faltantes
13:09 min
Persistencia y particionado
Conclusiones
Conoce quién enseña el curso

Proyecto del curso

Manipula un amplio volumen de datos de los Juegos Olímpicos
Te encargarás de limpiar, procesar y filtrar los datos registrados durante décadas en los Juegos Olímpicos para obtener información clara de los mismos gracias al poder de Spark.
Ver proyectosoftware y recursos necesarios
- Terminal y línea de comandos.
- Jupyter.
4.3 · 279 opiniones


Enzo Rafael Cárdenas Nicho
Un curso algo dificil de entender, pero con conocimiento previo entenderlo es sencillo, creo que el profesor podría se más cuidadoso con los conceptos que brinda, asimismo el detalle de lo que menciona, pero finalmente pude aprender.


EL curso es bueno, te lleva mediante los elementos básicos de Spark y las mejores prácticas, el profesor tiene algunos errores durante el curso pero es muy bueno


José Luis Villarreal
Buen curso, seria bueno actualizarlo ya que se han agregado nuevas funcionalidades a spark


Es muy didáctico


José Esteves
deben actualizar este curso, muchas funciones estan obsoletas


Nelson García
El curso es muy bueno como introduccióin a Spark y la documentación de Jupyter en el repositorio de Git esta genial


Yirimer Turga Wilches
Buen método de enseñanza, información concreta

Darrien Sequera
Excelente curso. Recomendaría actualizarlo. Y complementarlo con un curso intermedio.


Andres Lozano Cardozo
Muy buen curso, el manejo que dio el profe durante los modulos y el desarrollo de este curso, fue espectacular, espero verlo en un futuro cercano de nuevo.

Jose Arnulfo Gonzalez Torres
EL DOCENTE EXPLICA MUY BIEN


Natalia Restrepo Parra
La información brindada por el profesor es clara y coherente con los objetivos del curso


Mateo Tabares Espinosa
'


Byron Boada
Es un curso muy útil para iniciar con spark


Jhonathan Ortiz
Excelente introduccion dejando todos los conceptos claros


Samuel Joshua Reyes Martínez
Buen curso para los que no sabíamos nada de spark, estaría bien si hicieran otro curso que complemente a este y que sea en collab


Juan Diego Gallego Villada
Excelente curso. Los ejercicios propuestos son retadores y ayudan a interiorizar mejor los conceptos.

Jorge Alberto Luna Lopez
Vi quejas de lo avanzado y complejo del curso me parece que para llegar a el ya debes conocer SQL y python intermedio, en lo personal llevo años trabajando con SQL y programando en otros lenguajes ademas de ambientes Linux, todo me funciono excelente, recomiendo mucho este curso para empezar con Spark, espero haya nuevos cursos mas avanzados.


Rafael Arana
Me gusto este curso por que te explica muy bien el profesor, pero hubo momentos que se complicaba un poco, ademas de eso, me parecio un muy buen curso

Sergio Enrique Alba Hernández
Explica muy bien los conceptos y adicional los ejemplos de cada uno son muy importantes para poner en practica los conceptos


Fernando Garcia de la Cruz
Muy buena introducción a Spark se me han aclarado muchas cosas, el profesor lo hizo ameno.


Alvaro Cardenas
Quizás faltó una proximación a modo producción, no solo stand alone. Trabajar con más datos.


Don Alfredo Fuentes Araque
Muy buen curso para tener unos buenos fundamentos en el uso de apache spark. El profesor explica de una forma muy clara.


Jhoan Felipe Montoya Uran
Aprender la relacion con hadoop y hacer ambientes virtuales de trabajo para para crear y transformar RDD

Garro Ladino Sergio Ezequiel
me encanto el curso, excelente profesor


Buen curso, aunque me hubiera gustado aprender cómo se puede conectar spark con bases de datos SQL.


Edgar Rafael Melgarejo Puelles
preciso en contenido muy bien explicado y con los temas exactos. Buen curso


Paul Peñaherrera
Me gustó el curso porque proporciona todo el material necesario para un trabajo y aprendizaje optimo.


Platzi Team
Muy bueno el curso. Una excelente herramienta para el análisis de datos.


Jose Ramon Moreno Sanchez
Spark es un tema muy interesante. Me gustaría ver mas cursos usando la herramienta o mas casos de uso. El profe muy bien 100%.

Mitchell Mirano
fue un curso genial para conocer los fundamentos de Spark Gracias profesor Oscar ... espero salga un curso avanzado de Spark próximamente.
Este curso es parte de estas rutas de aprendizaje
La comunidad es nuestro super poder
Contenido adicional creado por la comunidad que nunca para de aprender



