Introducci贸n a 谩rboles de decisi贸n

1

驴Qu茅 son los 谩rboles de decisi贸n?

2

Tu primer 谩rbol de decisi贸n con scikit-learn

3

An谩lisis de datos para tu primer 谩rbol de decisi贸n

4

Entrenamiento y evaluaci贸n de 谩rbol de decisi贸n con scikit-learn

5

驴C贸mo funcionan los 谩rboles de decisi贸n?

6

驴Cu谩ndo usar 谩rboles de decisi贸n?

Quiz: Introducci贸n a 谩rboles de decisi贸n

Proyecto pr谩ctico: 谩rboles de decisi贸n

7

Conociendo problema a resolver y dataset de clasificaci贸n

8

An谩lisis exploratorio de datos para 谩rbol de decisi贸n

9

Procesamiento de datos para el entrenamiento de 谩rbol de decisi贸n

10

Entrenamiento de modelo de clasificaci贸n con 谩rbol de decisi贸n

11

驴C贸mo evaluar un modelo de 谩rbol de decisi贸n?

12

Evaluaci贸n de resultados del modelo de 谩rbol de decisi贸n

Quiz: Proyecto pr谩ctico: 谩rboles de decisi贸n

Introducci贸n a random forest

13

驴Qu茅 son los random forest o bosques aleatorios?

14

Tu primer random forest con scikit-learn

15

An谩lisis de datos para tu primer random forest

16

Entrenamiento de tu primer modelo de random forest con scikit-learn

17

Evaluaci贸n de tu primer modelo de random forest con scikit-learn

18

驴C贸mo funcionan los random forest?

19

驴Cu谩ndo utilizar random forest?

Quiz: Introducci贸n a random forest

Proyecto pr谩ctico: random forest

20

Entrenamiento de modelo de clasificaci贸n de carros con random forest

21

Evaluaci贸n de resultados del modelo de clasificaci贸n con random forest

Quiz: Proyecto pr谩ctico: random forest

Conclusi贸n

22

Proyecto final y cierre

23

Comparte tu proyecto de Random Forest y obt茅n tu certificado

No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

An谩lisis de datos para tu primer random forest

15/23
Recursos

Aportes 6

Preguntas 1

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

df_diabetes.columns = [鈥1. Number of times pregnant鈥, 鈥2. Plasma glucose concentration a 2 hours in an oral glucose tolerance test鈥, 鈥3. Diastolic blood pressure (mm Hg)鈥, 鈥4. Triceps skin fold thickness (mm)鈥, 鈥5. 2-Hour serum insulin (mu U/ml)鈥, 鈥6. Body mass index (weight in kg/(height in m)^2)鈥, 鈥7. Diabetes pedigree function鈥, 鈥8. Age (years)鈥, 鈥9. Class variable (0 or 1)鈥橾

#Renombramos las columnas
df_diabetes.columns = ['1. Number of times pregnant', '2. Plasma glucose concentration a 2 hours in an oral glucose tolerance test', '3. Diastolic blood pressure (mm Hg)', '4. Triceps skin fold thickness (mm)', '5. 2-Hour serum insulin (mu U/ml)', '6. Body mass index (weight in kg/(height in m)^2)', '7. Diabetes pedigree function', '8. Age (years)', '9. Class variable (0 or 1)']

Tambien, hay columnas que tienen missing values pero de manera implicita. Se reconocen por que su valor es 0 y a nivel medico, no tendria sentido ese valor.

df.iloc[:, 1:6].replace(to_replace=[0], value=np.nan).isna().sum().reset_index(name = 'missing_values').rename(columns={"index": "variable"}).assign( percentage = lambda df_reset: df_reset.missing_values / len(df) * 100)

variable_____missing_values____percentage
Glucose_________5_____0.651042
BloodPressure____35____4.557292
SkinThickness____227___29.557292
Insulin__________374____48.697917
BMI____________11_____1.432292

Excelente! 馃懇馃徎馃捇
Estar铆a bueno que en un curso hicieran un an谩lisis de datos mas avanzado, no tan simple como lo veo en todos los cursos, el an谩lisis de datos es algo esencial, y siempre veo que hacen lo mas sencillo.

C贸digo de la clase:

#Renombramos las columnas
df_diabetes.columns = ['1. Number of times pregnant', '2. Plasma glucose concentration a 2 hours in an oral glucose tolerance test', '3. Diastolic blood pressure (mm Hg)', '4. Triceps skin fold thickness (mm)', '5. 2-Hour serum insulin (mu U/ml)', '6. Body mass index (weight in kg/(height in m)^2)', '7. Diabetes pedigree function', '8. Age (years)', '9. Class variable (0 or 1)']
#Verificacion de datos
df_diabetes.head()

#Analizamos el shape del objeto
df_diabetes.shape
**

df_diabetes.dtypes
df_diabetes.isnull().sum()