Justificación y contexto de tu proyecto

1

Cómo crear tu proyecto de ciencia de datos

2

Crea proyectos para afianzar tus conocimientos en ciencia de datos

3

Cada cuánto hacer un proyecto de datos

4

Dónde sacar ideas para proyectos de ciencia de datos

5

Generar y comunicar un proyecto de datos

6

Casos: personas que ya pasaron por este camino

Quiz: Justificación y contexto de tu proyecto

Ejecutando un proyecto de ciencia de datos

7

Plantea una pregunta interesante

8

Obteniendo los datos para tu proyecto

9

Ejecutando: obteniendo los datos

10

Limpieza de la información

11

Ejecutando: limpia tu conjunto de datos

12

Explora y encuentra patrones en la información

13

Ejecutando: exploración de la información

14

Ejecutando: completando la exploración de la información

15

Enriquecimiento de los datos para análisis profundo

16

Ejecutando: enriquecimiento de los datos

17

Aplicando un modelo de machine learning

18

Ejecutando: aplicando un modelo supervisado de machine learning

19

Ejecutando: aplicando un modelo no supervisado de machine learning

20

Ejecutando: aplicando un modelo no supervisado de anomalías

21

Prepara tu trabajo para comunicarlo con el mundo

22

Ejecutando: prepara tu trabajo para comunicarlo con el mundo

Quiz: Ejecutando un proyecto de ciencia de datos

Comunicando los resultados

23

Por qué es importante comunicar los resultados

24

Escribiendo tu primer blogpost técnico

25

Compartiendo en comunidad con tu primera presentación

26

Cómo mejorar tu repositorio en GitHub para ciencia de datos

27

Haciendo deploy de tus modelos

28

Construyendo una aplicación full stack que consuma tu proyecto

Quiz: Comunicando los resultados

Últimos pasos

29

Elige terminar: es mejor terminado que perfecto

30

Recuerda los objetivos del proyecto: practicar y carta de presentación

31

Comparte tu proyecto

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Ejecutando: enriquecimiento de los datos

16/31
Recursos

Aportes 5

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

o inicia sesión.

df['DIA'] = df['FECHA'].dt.day
df['MES'] = df['FECHA'].dt.month
df['YEAR'] = df['FECHA'].dt.year

Pueden utilizar herramientas como Featuretools para automatizar el proceso de enriquecimiento de datos

En mi proyecto yo aplique feature engineering:

Crearemos una nueva categoria, para denotar el objetivo del ejercicio (por ejemplo, perder peso, aumentar masa muscular, mejorar la resistencia, etc.).

Posible clasificación de los tipos de ejercicios y sus objetivos principales correspondientes realizada por CHATGPT:

  • burning: Strength, Hypertrophy, Power, Functional training.
  • Stretching: Flexibility, Mobility, Rehabilitation, Stress reduction.
  • Plyometrics: Power, Agility, Explosive Strength, Functional Training.
  • Powerlifting: Strength, Hypertrophy, Power, Functional Training.
  • Cardio: Cardiovascular resistance, Fat burning, Functional training.
  • Olympic Weightlifting: Strength, Hypertrophy, Power, Functional Training.
  • Strongman: Strength, Hypertrophy, Power, Functional Training.
# Creamos las nuevas columnas "TrainingGoal" en el DataFrame
df_data_processing["TrainingGoal_Strength"] = ""
df_data_processing["TrainingGoal_Hypertrophy"] = ""
df_data_processing["TrainingGoal_Power"] = ""
df_data_processing["TrainingGoal_Functional Training"] = ""
df_data_processing["TrainingGoal_Flexibility"] = ""
df_data_processing["TrainingGoal_Mobility"] = ""
df_data_processing["TrainingGoal_Rehabilitation"] = ""
df_data_processing["TrainingGoal_Stress Reduction"] = ""
df_data_processing["TrainingGoal_Agility"] = ""
df_data_processing["TrainingGoal_Explosive Strength"] = ""
df_data_processing["TrainingGoal_Cardiovascular Endurance"] = ""
df_data_processing["TrainingGoal_FatBurning"] = ""

# Asignamos un valor correspondiente a cada columna "TrainingGoal" para cada valor de la columna "Type"
for idx, value in df_data["Type"].iteritems():
    if value in ["Strength", 'Powerlifting', 'Olympic Weightlifting', 'Strongman']:
        df_data_processing.loc[idx, "TrainingGoal_Strength"] = 1.0
    else:
        df_data_processing.loc[idx, "TrainingGoal_Strength"] = 0.0


    if value in ["Strength", 'Powerlifting', 'Olympic Weightlifting', 'Strongman']:
        df_data_processing.loc[idx, "TrainingGoal_Hypertrophy"] = 1.0
    else:
        df_data_processing.loc[idx, "TrainingGoal_Hypertrophy"] = 0.0


    if value in ["Strength", 'Powerlifting', 'Olympic Weightlifting', 'Strongman', 'Plyometrics']:
        df_data_processing.loc[idx, "TrainingGoal_Power"] = 1.0
    else:
        df_data_processing.loc[idx, "TrainingGoal_Power"] = 0.0
        

    if value in ["Plyometrics", 'Powerlifting', 'Olympic Weightlifting', 'Strongman']:
        df_data_processing.loc[idx, "TrainingGoal_Functional Training"] = 1.0
    else:
        df_data_processing.loc[idx, "TrainingGoal_Functional Training"] = 0.0


    if value in ["Stretching"]:
        df_data_processing.loc[idx, "TrainingGoal_Flexibility"] = 1.0
    else:
        df_data_processing.loc[idx, "TrainingGoal_Flexibility"] = 0.0


    if value in ["Stretching"]:
        df_data_processing.loc[idx, "TrainingGoal_Mobility"] = 1.0
    else:
        df_data_processing.loc[idx, "TrainingGoal_Mobility"] = 0.0


    if value in ["Stretching"]:
        df_data_processing.loc[idx, "TrainingGoal_Rehabilitation"] = 1.0
    else:
        df_data_processing.loc[idx, "TrainingGoal_Rehabilitation"] = 0.0


    if value in ["Stretching"]:
        df_data_processing.loc[idx, "TrainingGoal_Stress Reduction"] = 1.0
    else:
        df_data_processing.loc[idx, "TrainingGoal_Stress Reduction"] = 0.0


    if value in ["Plyometrics"]:
        df_data_processing.loc[idx, "TrainingGoal_Agility"] = 1.0
    else:
        df_data_processing.loc[idx, "TrainingGoal_Agility"] = 0.0


    if value in ["Plyometrics"]:
        df_data_processing.loc[idx, "TrainingGoal_Explosive Strength"] = 1.0
    else:
        df_data_processing.loc[idx, "TrainingGoal_Explosive Strength"] = 0.0


    if value in ["Cardio"]:
        df_data_processing.loc[idx, "TrainingGoal_Cardiovascular Endurance"] = 1.0
    else:
        df_data_processing.loc[idx, "TrainingGoal_Cardiovascular Endurance"] = 0.0


    if value in ["Cardio"]:
        df_data_processing.loc[idx, "TrainingGoal_FatBurning"] = 1.0
    else:
        df_data_processing.loc[idx, "TrainingGoal_FatBurning"] = 0.0

Ya antes había planificado enriquecer los datos sin saber como se le llama a ese proceso 😅.

hay forma de que al momento de cargar el dataset, pandas te ponga la columna FECHA en formato datetime64.

compras_df = pd.read_csv(’/mnt/e/RICARDO/Documents/curso_crear_proyectos_ciencia_datos/notebooks/data/clean_compras.csv’,parse_dates=[‘FECHA’])