df['DIA'] = df['FECHA'].dt.day
df['MES'] = df['FECHA'].dt.month
df['YEAR'] = df['FECHA'].dt.year
Justificación y contexto de tu proyecto
Cómo crear tu proyecto de ciencia de datos
Crea proyectos para afianzar tus conocimientos en ciencia de datos
Cada cuánto hacer un proyecto de datos
Dónde sacar ideas para proyectos de ciencia de datos
Generar y comunicar un proyecto de datos
Casos: personas que ya pasaron por este camino
Quiz: Justificación y contexto de tu proyecto
Ejecutando un proyecto de ciencia de datos
Plantea una pregunta interesante
Obteniendo los datos para tu proyecto
Ejecutando: obteniendo los datos
Limpieza de la información
Ejecutando: limpia tu conjunto de datos
Explora y encuentra patrones en la información
Ejecutando: exploración de la información
Ejecutando: completando la exploración de la información
Enriquecimiento de los datos para análisis profundo
Ejecutando: enriquecimiento de los datos
Aplicando un modelo de machine learning
Ejecutando: aplicando un modelo supervisado de machine learning
Ejecutando: aplicando un modelo no supervisado de machine learning
Ejecutando: aplicando un modelo no supervisado de anomalías
Prepara tu trabajo para comunicarlo con el mundo
Ejecutando: prepara tu trabajo para comunicarlo con el mundo
Quiz: Ejecutando un proyecto de ciencia de datos
Comunicando los resultados
Por qué es importante comunicar los resultados
Escribiendo tu primer blogpost técnico
Compartiendo en comunidad con tu primera presentación
Cómo mejorar tu repositorio en GitHub para ciencia de datos
Haciendo deploy de tus modelos
Construyendo una aplicación full stack que consuma tu proyecto
Quiz: Comunicando los resultados
Últimos pasos
Elige terminar: es mejor terminado que perfecto
Recuerda los objetivos del proyecto: practicar y carta de presentación
Comparte tu proyecto
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Aportes 5
Preguntas 2
df['DIA'] = df['FECHA'].dt.day
df['MES'] = df['FECHA'].dt.month
df['YEAR'] = df['FECHA'].dt.year
Pueden utilizar herramientas como Featuretools para automatizar el proceso de enriquecimiento de datos
En mi proyecto yo aplique feature engineering:
Crearemos una nueva categoria, para denotar el objetivo del ejercicio (por ejemplo, perder peso, aumentar masa muscular, mejorar la resistencia, etc.).
Posible clasificación de los tipos de ejercicios y sus objetivos principales correspondientes realizada por CHATGPT:
# Creamos las nuevas columnas "TrainingGoal" en el DataFrame
df_data_processing["TrainingGoal_Strength"] = ""
df_data_processing["TrainingGoal_Hypertrophy"] = ""
df_data_processing["TrainingGoal_Power"] = ""
df_data_processing["TrainingGoal_Functional Training"] = ""
df_data_processing["TrainingGoal_Flexibility"] = ""
df_data_processing["TrainingGoal_Mobility"] = ""
df_data_processing["TrainingGoal_Rehabilitation"] = ""
df_data_processing["TrainingGoal_Stress Reduction"] = ""
df_data_processing["TrainingGoal_Agility"] = ""
df_data_processing["TrainingGoal_Explosive Strength"] = ""
df_data_processing["TrainingGoal_Cardiovascular Endurance"] = ""
df_data_processing["TrainingGoal_FatBurning"] = ""
# Asignamos un valor correspondiente a cada columna "TrainingGoal" para cada valor de la columna "Type"
for idx, value in df_data["Type"].iteritems():
if value in ["Strength", 'Powerlifting', 'Olympic Weightlifting', 'Strongman']:
df_data_processing.loc[idx, "TrainingGoal_Strength"] = 1.0
else:
df_data_processing.loc[idx, "TrainingGoal_Strength"] = 0.0
if value in ["Strength", 'Powerlifting', 'Olympic Weightlifting', 'Strongman']:
df_data_processing.loc[idx, "TrainingGoal_Hypertrophy"] = 1.0
else:
df_data_processing.loc[idx, "TrainingGoal_Hypertrophy"] = 0.0
if value in ["Strength", 'Powerlifting', 'Olympic Weightlifting', 'Strongman', 'Plyometrics']:
df_data_processing.loc[idx, "TrainingGoal_Power"] = 1.0
else:
df_data_processing.loc[idx, "TrainingGoal_Power"] = 0.0
if value in ["Plyometrics", 'Powerlifting', 'Olympic Weightlifting', 'Strongman']:
df_data_processing.loc[idx, "TrainingGoal_Functional Training"] = 1.0
else:
df_data_processing.loc[idx, "TrainingGoal_Functional Training"] = 0.0
if value in ["Stretching"]:
df_data_processing.loc[idx, "TrainingGoal_Flexibility"] = 1.0
else:
df_data_processing.loc[idx, "TrainingGoal_Flexibility"] = 0.0
if value in ["Stretching"]:
df_data_processing.loc[idx, "TrainingGoal_Mobility"] = 1.0
else:
df_data_processing.loc[idx, "TrainingGoal_Mobility"] = 0.0
if value in ["Stretching"]:
df_data_processing.loc[idx, "TrainingGoal_Rehabilitation"] = 1.0
else:
df_data_processing.loc[idx, "TrainingGoal_Rehabilitation"] = 0.0
if value in ["Stretching"]:
df_data_processing.loc[idx, "TrainingGoal_Stress Reduction"] = 1.0
else:
df_data_processing.loc[idx, "TrainingGoal_Stress Reduction"] = 0.0
if value in ["Plyometrics"]:
df_data_processing.loc[idx, "TrainingGoal_Agility"] = 1.0
else:
df_data_processing.loc[idx, "TrainingGoal_Agility"] = 0.0
if value in ["Plyometrics"]:
df_data_processing.loc[idx, "TrainingGoal_Explosive Strength"] = 1.0
else:
df_data_processing.loc[idx, "TrainingGoal_Explosive Strength"] = 0.0
if value in ["Cardio"]:
df_data_processing.loc[idx, "TrainingGoal_Cardiovascular Endurance"] = 1.0
else:
df_data_processing.loc[idx, "TrainingGoal_Cardiovascular Endurance"] = 0.0
if value in ["Cardio"]:
df_data_processing.loc[idx, "TrainingGoal_FatBurning"] = 1.0
else:
df_data_processing.loc[idx, "TrainingGoal_FatBurning"] = 0.0
Ya antes había planificado enriquecer los datos sin saber como se le llama a ese proceso 😅.
hay forma de que al momento de cargar el dataset, pandas te ponga la columna FECHA en formato datetime64.
compras_df = pd.read_csv(’/mnt/e/RICARDO/Documents/curso_crear_proyectos_ciencia_datos/notebooks/data/clean_compras.csv’,parse_dates=[‘FECHA’])
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?
o inicia sesión.