Comenzando con pandas
¿Qué es pandas?
Series e Indexación y selección de datos
De paneles de datos al DataFrame
Indexado y manejo de archivos CSV
Conexión con bases de datos tipo SQL
Ventajas y desventajas de los formatos de importar y guardado
Funcionalidades básicas y esenciales de pandas
Formatos de lectura para cargar y guardar DataFrames
Tipos de Variables que componen un data frame
Estructuras de dataframes en detalle
Borrar filas, columnas y copiar información
Aplicando pandas
Funciones matemáticas
Funciones más complejas y lambdas
Múltiples Ãndices
Cómo trabajar con variables tipo texto en Pandas
Concatenación de DataFrames: concat y append
Merge de DataFrames
¿Cómo lidiar con datos faltantes en tus DataFrames?
Group by
Cómo lidiar con datos duplicados en Pandas
Aggregation y groupby
Group By: extraer valor con variables categóricas
Tablas dinámicas con Pivot Table
Series de Tiempo
Series de Tiempo: variables nulas
Visualización y graficación de datos
Contenido extra
Iniciando una rutina tÃpica de manejo de datos
Preprocesamiento de datos: terminando de preparar y limpiar los datasets
Análisis de datos
Aún no tienes acceso a esta clase
Crea una cuenta y continúa viendo este curso
Aportes 26
Preguntas 6
En el minuto 7:45 cuando se va a almacenar el resultado del fillna sobre df_diff, también se puede hacer de la siguiente:
df_diff.fillna({'Confirmed': 555.0,
'Deaths': 17.0,
'Recovered': 28.0},
inplace = True)
y vemos como el resultado es el mismo:
Algunas opciones de resample
Alias - Description
B - Business day
D - Calendar day
W - Weekly
M - Month end
Q - Quarter end
A - Year end
BA - Business year end
AS - Year start
H - Hourly frequency
T, min - Minutely frequency
S - Secondly frequency
L, ms - Millisecond frequency
U, us - Microsecond frequency
N, ns - Nanosecond frequency
Para calcular las variaciones porcentuales:
df_time.pct_change()
Jajajaj en tiempos de coronavirus temprano
comparto mi opinion respecto a: df1 - df2
. lo cual es una lectura alentadora que nos habla de una mejoria en las condiciones de tratamiento
por ejemplo, continuar algun tratamiento que se haya realizado durante esas fechas y que ha dado resultados favorables.
. esto lo hemos visualizado rapidamente a partir de la seleccion que hemos hecho, lo que no hubiera sido posible o muy dificil de ver a partir de todos los datos en bruto del DF original
Un curso de analisis de series temporales seria algo muy util de aprender.
thanks
No sé por qué, pero el dataset que descargué tiene más muertos el 23-enero que el 24-enero. O sea, resucitó gente, por lo que se debe tomar decisiones sabiendo esto.
Excelente clase, las funciones de diff() y cumsum() son una maravilla. Hacer eso por query en bds transaccionales es tedioso y en varias lÃneas y aquà ¡boom!, súper rápido y sencillo 😄
Les muestro el conteido de esta clase a modo resumen
df.sample(5)
df['ObservationDate'] = pd.to_datetime(df['ObservationDate'])
df = df[[
'ObservationDate',
'Country/Region',
'Confirmed',
'Deaths',
'Recovered']]
df_time = df.groupby('ObservationDate').sum()
df1 = df_time['Confirmed'].iloc[10:15]
df2 = df_time['Deaths'].iloc[12:17]
df1 - df2
#Diferencial de la serie, y el promedio de de esta.
df_diff = df_time.diff()
df_time.diff().mean()
df_time.head(1).to_dict()
df_diff = df_diff.fillna({'Confirmed': 555.0,
'Deaths': 17.0,
'Recovered': 28.0})
df_diff.cumsum()
df_diff.resample('7D').sum()
df_diff.resample('W-Sun').sum()
df_diff.resample('M').sum()
df_diff.resample('M').count()
me encanta este cursoooo
Entendido
Mi solucion para el minuto 7:34 fue
df_diff = df_time.diff()
line1 = df_time.head(1)
df_diff.iloc[0] = line1
Excelente clase
una forma de obtener el diccionario para aplicar en df_diff.fillna() es la siguiente:
dictnan = df_time.head(1).reset_index().drop(['ObservationDate','SNo'], axis = 1).to_dict('records')
df_diff.fillna(dictnan[0], inplace=True)
dale una mirada y me cuentas
Esto es muy util por que en la mayoria de informacion se manejan fechas.
Yo juraba que Ãbamos a ver series de Fourier, jajaja!
Vamos a aprender a cómo utilizar la función resample en series de tiempo para extraer valor estadÃstico de nuestros datos, como va cambiando el número de casos dada una frecuencia determinada como lo es el mes, la semana, etc.
excelente curso
Excelente
En esta clase tarde como dos horas explotando este DF, las series de tiempo son sumamente útiles, ver como se comportan los datos a través de un histórico y las operaciones que puedes hacer con ellos son geniales, me apoyé mucho también de la visualización.
Dar formato de tiempo
Agrupar por fechas (Que el Ãndice sean las fechas)
Encontrar la diferencia de la variable dependiente a lo largo del tiempo.
Restar los datos que coincidan con la fecha
¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.