Este curso es excelente, de los mejores que tiene platzi, combinando teoria y práctica con DataSets reales 😄
Comenzando con pandas
¿Qué es pandas?
Series e Indexación y selección de datos
De paneles de datos al DataFrame
Indexado y manejo de archivos CSV
Conexión con bases de datos tipo SQL
Ventajas y desventajas de los formatos de importar y guardado
Funcionalidades básicas y esenciales de pandas
Formatos de lectura para cargar y guardar DataFrames
Tipos de Variables que componen un data frame
Estructuras de dataframes en detalle
Borrar filas, columnas y copiar información
Aplicando pandas
Funciones matemáticas
Funciones más complejas y lambdas
Múltiples índices
Cómo trabajar con variables tipo texto en Pandas
Concatenación de DataFrames: concat y append
Merge de DataFrames
¿Cómo lidiar con datos faltantes en tus DataFrames?
Group by
Cómo lidiar con datos duplicados en Pandas
Aggregation y groupby
Group By: extraer valor con variables categóricas
Tablas dinámicas con Pivot Table
Series de Tiempo
Series de Tiempo: variables nulas
Visualización y graficación de datos
Contenido extra
Iniciando una rutina típica de manejo de datos
Preprocesamiento de datos: terminando de preparar y limpiar los datasets
Análisis de datos
Aún no tienes acceso a esta clase
Crea una cuenta y continúa viendo este curso
Aportes 54
Preguntas 3
Este curso es excelente, de los mejores que tiene platzi, combinando teoria y práctica con DataSets reales 😄
Pairplot es una buena alternativa de scatter_matrix. Está en la librería seaborn
sns.pairplot(df_med.reset_index())
Este curso deberia ser uno de los primeros al entrar al mundo de Data Science. Excelente curso, buen profesor y el contenido tanto teorico y practico son una chulada. Mas cursos asi por favor.
Le comparto la URL donde pueden encontrar los distintos mapas de colores, tambien existen mapas de colores especiales para variables categoricas, en las que en lugar de ser un gradiente son colores fijos. Los pueden checar en la documentacion.
https://matplotlib.org/tutorials/colors/colormaps.html
En este caso yo hice relacionado a los datos de Ecuador
, no tiene relación con la deforestacion ni la agricultura y generalmente las comunidades tienen mucha resistencia a las hidroeléctricas por esos temas.
Este curso es poesía pura, Debería estar en el apartado de " Intermedio" en la carrera de DS.
Me encantó este último ejercicio (3 últimos videos). Excelente curso.
A este curso hay que darle 10 estrellas. Mi único contra es que debería estar mucho antes en la ruta de Ciencia de Datos al ser Pandas una de las librerías más usadas.
Una forma para que no salga todo ese texto previo al gráfico es colocar un ; al final de la última línea de código relacionada con el gráfico 😄.
Pero que señor Curso este, muuuuuy bueno. Lo único que lamento es que no esté algo más en la parte media de la Escuela de Data Science, sobretodo considerando que el profe hizo una curva de dificultad bastante amena.
10/10
pongan punto y coma (😉 después de cada código de los gráficos para que no aparezcan esas líneas
Excelente curso, muy bien preparado previamente el material y eso queda reflejado en el curso.
Ojo que el dataset “forest” no es de deforestación, sino de área de bosques. Eso le da más sentido a algunas de las correlaciones que se ven de esta variable, por ejemplo, las correlaciones inversas de área de bosques con el nivel de co2, con la producción eléctrica y con la fecha (a medida que avanza el tiempo, hay menos bosques).
Excelente curso, deja tanta información que es dificil recordarla toda, sin embargo, uno ya sabe que existe para usarla en el futuro
Muy buen curso la verdad, incluso considero que tal vez deberia de estar antes en la escuela de data science
Este curso es para 10 estrellas. Mi único pero es que debería estar antes en la ruta de Ciencias de Datos al ser Pandas una libreria de uso frecuente.
Muy buen curso!
excelente curso!
Excelente curso. Demasiada información pero muy bien explicada.
Para agrandar el gráfico de la correlación ejecuten este código:
import matplotlib.pyplot as plt
fig, ax = plt.subplots(figsize=(10,8))
sns.heatmap(df_climate.corr(), annot=True, ax=ax)
donde puedo encontrar datasets para practicar la limpia de datatos o data wrangling o con cualquiera sirve ?
5 estrellas el curso! muy práctico todo!
Excelente curso… me la pase haciendo ejercicio tras ejercicio…
Genial el curso. Espero con impaciencia cuando te vas a dar un curso de redes convolutivas
Haciendo el ejercicio sólo para Colombia me surgió una reflexión en torno al dato de la correlación entre CO2 - temperatura (0.14) y CO2 - consumo eléctrico (0.92):
El país esta claramente perfilado como una región en vía de desarrollo según las dinámicas de cambio climático, en donde su propia producción de CO2 no es tan significativa como para relacionarse directamente al aumento de temperaturas medias en el territorio, por lo que no tiene una economía industrial grande que imprima gases efecto invernadero significativamente. Sin embargo, la relación alta con la demanda energética muestra que las dinámicas de crecimiento del país siguen la tendencia del desarrollo moderno, entre más gasto energético, más emisión de CO2, ya sea por transporte, industria o comercio.
Genial esta clase
Me encantó este curso. Cada vez adquirimos más herramientas para hacer data analysis. Sin duda Pandas es de las herramientas más completas y útiles. Gracias David, excelente curso!
este curso es excelente, se siente como si es el paso previo al curso de Tableau
me perdi las dos ultimas clases porque the world bank esta caido:( , F
el curso me lo acaban de quitar de la carrera de Ingeniero de machine learning
es muy bueno me gustaría otro donde se apliquen modelos de machine learning
Excelente curso y continuar practicando todas las opciones y ejemplos visto aqui
Hola, les comparto un pequeño proyecto que hice para reforzar lo aprendido en el curso.
Es sobre los datos de usuario que podemos solicitar a Uber, nos envían los datos de Uber Eats y Trips, los invito a explorar sus datos en la plataforma, si son usuarios frecuentes pueden encontrar cosas curiosas.
👉 Acá les dejo el repo.
La cantidad de cosas que puedes ver usando python con pandas, numpy y matplotlib es enorme, si hacemos lo básico cualquier excel puede reemplazarlo, pero el nivel de profundidad al que se llega si sabemos usar los códigos muestra historias muy completas.
Analisis de coordenadas paralelas sobre paises de norte america
Excelente curso, mismo que aplicaré en la institución donde presto mis servicios profesionales.
Lo que yo hice fue correlacionar las variables que tenía mi DataSet pero, para Colombia. Esta fue la Viz:
Buen curso, a seguir aprendiendo
Un curso muy valioso y muy útil, tiene infinidad de aplicaciones y abre el camino para profundizar y dominar el manejo de datos en Python
Los 10 países con más emisiones de CO2.
Se nota cuando un profesor es experto en la materia del curso que imparte. De los mejores cursos
Excelente curso!
El mejor curso hasta ahora que he tomado en mi vida.
Resume todo lo que hace un Data Sc con Python en solo un curso.
Excelente curso. Muchas gracias
Si desean eliminar el array que sale en la cabecera de los gráficos deben importar la librería de matplotlib.pyplot, y abajo de su código de la gráfica hacer un plt.show()
este curso es como una documentacion de pandas pero en video :V
Muy buena clase, me encanto diferentes datasets.
Analisis muy buenos,
varios tips.
Excelente curso, excelente profesor, explicación y didáctica. Espero que el mismo profesor dicte otros cursos a futuro.
Me encantó este curso!!! De lo mejor de Platzito
Excelente curso no me canso de decirlo y David de los mejores !!!
¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.