Introducción a árboles de decisión

1

¿Qué son los árboles de decisión?

2

Tu primer árbol de decisión con scikit-learn

3

Análisis de datos para tu primer árbol de decisión

4

Entrenamiento y evaluación de árbol de decisión con scikit-learn

5

¿Cómo funcionan los árboles de decisión?

6

¿Cuándo usar árboles de decisión?

Quiz: Introducción a árboles de decisión

Proyecto práctico: árboles de decisión

7

Conociendo problema a resolver y dataset de clasificación

8

Análisis exploratorio de datos para árbol de decisión

9

Procesamiento de datos para el entrenamiento de árbol de decisión

10

Entrenamiento de modelo de clasificación con árbol de decisión

11

¿Cómo evaluar un modelo de árbol de decisión?

12

Evaluación de resultados del modelo de árbol de decisión

Quiz: Proyecto práctico: árboles de decisión

Introducción a random forest

13

¿Qué son los random forest o bosques aleatorios?

14

Tu primer random forest con scikit-learn

15

Análisis de datos para tu primer random forest

16

Entrenamiento de tu primer modelo de random forest con scikit-learn

17

Evaluación de tu primer modelo de random forest con scikit-learn

18

¿Cómo funcionan los random forest?

19

¿Cuándo utilizar random forest?

Quiz: Introducción a random forest

Proyecto práctico: random forest

20

Entrenamiento de modelo de clasificación de carros con random forest

21

Evaluación de resultados del modelo de clasificación con random forest

Quiz: Proyecto práctico: random forest

Conclusión

22

Proyecto final y cierre

23

Comparte tu proyecto de Random Forest y obtén tu certificado

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Tu primer random forest con scikit-learn

14/23
Recursos

Aportes 7

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Me gusta está clase, hasta el momento se han trabajado 3 data sets de manera fluida, es una buena carga pedagógica 😄

Para cargar el dataset:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

url = 'https://5tm9.short.gy/pima-diabetes-data'
df_diabetes = pd.read_csv(url)
df_diabetes.head()
estos datasets que encontramos gratuitos son muy interesantes para aprender y practicar, sin embargo, son datasets que ya están muy manipulados, en la vida real los datasets suelen ser mucho mas complejos, me he encontrado con que el preprocesamiento de los datos es mucho mas complejo y demandante que la misma clasificación y análisis.
Para cargar el dataset pueden usar: ```python df_diabetes = pd.read_csv('https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv',header=None) df_diabetes.columns = ['Pregnancies', 'Glucose', 'BloodPressure (mm Hg)', 'SkinThickness (mm)', 'Insulin (mu U/ml)', 'BMI (kg/m^2)', 'DiabetesPedigreeFunction', 'Age (years)', 'Outcome'] df_diabetes.head() ```
Excelente! 👩🏻💻
Para cargar el dataset pueden usar: ```python df_diabetes = pd.read_csv('https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv',header=None) df_diabetes.columns = ['Pregnancies', 'Glucose', 'BloodPressure (mm Hg)', 'SkinThickness (mm)', 'Insulin (mu U/ml)', 'BMI (kg/m^2)', 'DiabetesPedigreeFunction', 'Age (years)', 'Outcome'] df_diabetes.head() ```