Introducción a árboles de decisión

1

¿Qué son los árboles de decisión?

2

Tu primer árbol de decisión con scikit-learn

3

Análisis de datos para tu primer árbol de decisión

4

Entrenamiento y evaluación de árbol de decisión con scikit-learn

5

¿Cómo funcionan los árboles de decisión?

6

¿Cuándo usar árboles de decisión?

Quiz: Introducción a árboles de decisión

Proyecto práctico: árboles de decisión

7

Conociendo problema a resolver y dataset de clasificación

8

Análisis exploratorio de datos para árbol de decisión

9

Procesamiento de datos para el entrenamiento de árbol de decisión

10

Entrenamiento de modelo de clasificación con árbol de decisión

11

¿Cómo evaluar un modelo de árbol de decisión?

12

Evaluación de resultados del modelo de árbol de decisión

Quiz: Proyecto práctico: árboles de decisión

Introducción a random forest

13

¿Qué son los random forest o bosques aleatorios?

14

Tu primer random forest con scikit-learn

15

Análisis de datos para tu primer random forest

16

Entrenamiento de tu primer modelo de random forest con scikit-learn

17

Evaluación de tu primer modelo de random forest con scikit-learn

18

¿Cómo funcionan los random forest?

19

¿Cuándo utilizar random forest?

Quiz: Introducción a random forest

Proyecto práctico: random forest

20

Entrenamiento de modelo de clasificación de carros con random forest

21

Evaluación de resultados del modelo de clasificación con random forest

Quiz: Proyecto práctico: random forest

Conclusión

22

Proyecto final y cierre

23

Comparte tu proyecto de Random Forest y obtén tu certificado

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

¿Cómo evaluar un modelo de árbol de decisión?

11/23
Recursos

Aportes 4

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Hola chicos! es muy importante que entendamos estas metricas, no solo para saber evaluar nuestros modelos de clasificacion, si no para hacerlo en funcion del modelo de negocio o de nuestro problema a resolver, al final las metricas son las que nos indican si el modelo tiene sentido con la realidad.

Un ejemplo muy util es saber evaluar el modelo de clasifiacacion con datos desbalanceados, donde podemos inducirnos al error por ver un accuracy de 90% y decimos eureca, y en la realidad no funciona nuestro modelo, pero porque?

Pues por que olvidamos ver la precision y el recall, para aterrizar mas esto podemos ver nuestro proyecto que cuenta con al rededor de 1700 datos en total y con 4 clases(unacc,acc,good,vgood) la clase unacc tiene 1210 datos, osea que arrastra el 70% de los datos, si evaluamos solo el accuracy podemos ver un modelo que llegue quizas al 80%, pero si evaluamos la precision y el recall para cada clase podriamos ver como la clase con mas datos tiene buenas metricas pero las demas no, enmascarando la supuesta generalizacion de nuestro modelo y exponiendo su mal performance quizas debido a las clases con menos datos. entonces ahi es donde comienza nuestro trabajo como Data scientist.

y tranquilos, si tienen dudas sobre esto o quieren dicutirlo, leo sus comentarios

saludos!

***Accuracy*** es la excactitud# Presicion de nuestro modelo ***Recall*** // Sensibilidad entender la tasa de verdaderos positivos ***Especificidad*** // nos hace entender la tasa de los verdaderos negativos ***F1*** resumen precisión y sensibilidad en una sola metrica.

Me confundí un poco pero, tras consultar mejor, esto me ayudo.



Agradecimiento especial a chatGPT

Resumen visual de la clase: