¿Cómo evaluar un modelo de árbol de decisión?

Clase 11 de 23 • Curso de Decision Trees y Random Forest con Python y scikit-learn

Contenido del curso

Introducción a árboles de decisión

Proyecto práctico: árboles de decisión

Introducción a random forest

Proyecto práctico: random forest

20
Entrenamiento de modelo de clasificación de carros con random forest
04:28 min
21
Evaluación de resultados del modelo de clasificación con random forest
11:34 min

Conclusión

Tomar examen

Comentarios

frank hurtado

student•

Hola chicos! es muy importante que entendamos estas metricas, no solo para saber evaluar nuestros modelos de clasificacion, si no para hacerlo en funcion del modelo de negocio o de nuestro problema a resolver, al final las metricas son las que nos indican si el modelo tiene sentido con la realidad.

Un ejemplo muy util es saber evaluar el modelo de clasifiacacion con datos desbalanceados, donde podemos inducirnos al error por ver un accuracy de 90% y decimos eureca, y en la realidad no funciona nuestro modelo, pero porque?

Pues por que olvidamos ver la precision y el recall, para aterrizar mas esto podemos ver nuestro proyecto que cuenta con al rededor de 1700 datos en total y con 4 clases(unacc,acc,good,vgood) la clase unacc tiene 1210 datos, osea que arrastra el 70% de los datos, si evaluamos solo el accuracy podemos ver un modelo que llegue quizas al 80%, pero si evaluamos la precision y el recall para cada clase podriamos ver como la clase con mas datos tiene buenas metricas pero las demas no, enmascarando la supuesta generalizacion de nuestro modelo y exponiendo su mal performance quizas debido a las clases con menos datos. entonces ahi es donde comienza nuestro trabajo como Data scientist.

y tranquilos, si tienen dudas sobre esto o quieren dicutirlo, leo sus comentarios

saludos!

Layla Scheli

teacher•

Gracias por tu aporte Frank :)

Max Baldiviezo

student•

Gracias por el aporte!

Aaron Chacon Morales

student•

Accuracy es la excactitud# Presicion de nuestro modelo

Recall // Sensibilidad entender la tasa de verdaderos positivos

Especificidad // nos hace entender la tasa de los verdaderos negativos

F1 resumen precisión y sensibilidad en una sola metrica.

Layla Scheli

teacher•

Gracias Aaron, es correcto. Buen aporte :P

Leandro Tenjo

student•

Me confundí un poco pero, tras consultar mejor, esto me ayudo.

… Agradecimiento especial a chatGPT

Layla Scheli

teacher•

Gracias Leandro :)

Jose Martin Rangel Espinoza

student•

Hola ¿cómo podrías interpretar el valor del F1-Score? ¿conviene que sea un valor menor o mayor?

Layla Scheli

teacher•

Hola Jose, mira este link :)

https://www.iartificial.net/precision-recall-f1-accuracy-en-clasificacion/

Antonio Demarco Bonino

student•

Y uno feliz aprendiendo de la medición de la clasificación:

Precisión te dice qué tan precisas son las predicciones positivas.
Recall te dice qué porcentaje de los casos positivos fueron detectados.
Exactitud te dice el rendimiento general del modelo.
Especificidad te dice qué tan bien detecta el modelo los casos negativos.

Julián Cárdenas

student•

Resumen visual de la clase:

Layla Scheli

teacher•

Excelente :)

Carlos Orozco

student•

como se nota que la profe es de verdad docente / investigadora y no solo desarrollador de software como casi el resto de los profes. instruir al resto de los profes en pedagogía debería ser un requisito para subir un curso

Sebastián Franco

student•

Las métricas son el concepto clave para evaluar el desempeño de un modelo de ML, en este caso del árbol de decisión

Múltiples métricas nacen a partir de la matriz de confusión, este es un recurso que permite evaluar el desempeño de un algoritmo de aprendizaje supervisado. Cada columna representa el número de predicciones de cada clase y cada fila representa a las instancias en la clase real, es decir, permite ver para cada clase cuántos predicciones hubo y cuántas son ciertas

En una matriz de confusión hay 4 posibles valores:

True Positives: Son aquellos samples predichos como positivos cuyo valor real es positivo, es un acierto
True Negatives: Son aquellos samples predichos como negativos cuyo valor real es negativo, es un acierto
False Positives: Son aquellos samples predichos como positivos cuyo valor real es negativo, es un error
False Negatives: Son aquellos samples predichos como negativos cuyo valor real es positivo, es un error

Entonces True Positives y True Negatives son aciertos, mientras que False Positives y False Negatives son errores

A partir de la matriz de confusión podemos extraer diferentes métricas:

Accuracy: Es la suma de todos los aciertos dividida entre todas las predicciones, es el porcentaje de elementos clasificados correctamente (TP + TN / TP + TN + FP + FN)
Precision: Es una métrica de dispersión, entre menor dispersión, mayor precisión. Se define como la proporción entre el número de predicciones correctas (tanto positivas como negativas) y el total de predicciones. En términos sencillos, es el porcentaje de casos positivos detectados (TP / TP + FP)
Recall: Es la tasa de verdaderos positivos ( TP / TP + FN)
Specificity: Es la tasa de los verdaderos negativos, la proporción de casos negativos que fueron correctamente identificados(TN / TN + FP)
F1 Score: De las métricas más importantes. Permite sintetizar precision y recall en una sola métrica (2 * precision * recall) / (precision + recall)

Una manera literal de entender cada métricas es:

Accuracy: Qué proporción de todas las predicciones fue correcta
Precision: Qué porcentaje de todos los positivos predichos son reales (Confianza en la clase evaluada)
Recall: Qué porcentaje de positivos reales detecté (Desempeño encontrando positivos)
Specificity: Qué porcentaje de negativos reales detecté (qué tan bueno es descartando negativos)

Mario Alexander Vargas Celis

student•

Evaluar un modelo de árbol de decisión implica analizar qué tan bien predice sobre datos nuevos. Aquí tienes los pasos más importantes para hacerlo:

✅ 1. Dividir los datos

Antes de entrenar, debes separar tu dataset:

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

✅ 2. Entrenar el modelo

from sklearn.tree import DecisionTreeClassifier

modelo = DecisionTreeClassifier(random_state=42) modelo.fit(X_train, y_train)

✅ 3. Realizar predicciones

y_pred = modelo.predict(X_test)

✅ 4. Evaluar el rendimiento

Usa métricas de clasificación:

from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

print("Accuracy:", accuracy_score(y_test, y_pred)) print("\nMatriz de confusión:\n", confusion_matrix(y_test, y_pred)) print("\nReporte de clasificación:\n", classification_report(y_test, y_pred))

🔍 ¿Qué significan estas métricas?

MétricaSignificadoAccuracyPorcentaje de predicciones correctasPrecisión (precision)Qué tan precisas son las predicciones positivasRecall (sensibilidad)Qué tanto recupera el modelo de las clases verdaderasF1-scoreBalance entre precisión y recallConfusion MatrixMuestra predicciones correctas vs. incorrectas por clase

✅ 5. Importancia de variables (opcional)

Para saber qué variables son más útiles:

import pandas as pd

importancia = modelo.feature_importances_ print(pd.DataFrame({'Feature': feature_names, 'Importancia': importancia}))

✅ 6. Validación cruzada (opcional)

Para tener una mejor idea del rendimiento general:

from sklearn.model_selection import cross_val_score

scores = cross_val_score(modelo, X, y, cv=5) print("Accuracy promedio:", scores.mean())

¿Cómo evaluar un modelo de árbol de decisión?

Introducción a árboles de decisión

¿Qué son los árboles de decisión?

Tu primer árbol de decisión con scikit-learn

Análisis de datos para tu primer árbol de decisión

Entrenamiento y evaluación de árbol de decisión con scikit-learn

¿Cómo funcionan los árboles de decisión?

¿Cuándo usar árboles de decisión?

Proyecto práctico: árboles de decisión

Conociendo problema a resolver y dataset de clasificación

Análisis exploratorio de datos para árbol de decisión

Procesamiento de datos para el entrenamiento de árbol de decisión

Entrenamiento de modelo de clasificación con árbol de decisión