Evaluación de resultados del modelo de clasificación con random forest

Curso de Decision Trees y Random Forest con Python y scikit-learn

Contenido del curso

Introducción a árboles de decisión

Proyecto práctico: árboles de decisión

Introducción a random forest

Proyecto práctico: random forest

20
Entrenamiento de modelo de clasificación de carros con random forest
04:28 min
21
Evaluación de resultados del modelo de clasificación con random forest
Viendo ahora

Conclusión

Tomar examen

Evaluación de resultados del modelo de clasificación con random forest

Sebastián Franco

Estudiante

Como paso final, se comparará el performance del modelo de Decision Tree y Random Forest


train\_accuracy\_rf = accuracy\_score(Y\_train, y\_pred\_train\_rf)

test\_accuracy\_rf = accuracy\_score(Y\_test, y\_pred\_test\_rf)



print(f"Train accuracy Decision Tree: {train\_accuracy\_tree}")

print(f"Test accuracy Decision Tree: {test\_accuracy\_tree}")



print(f"Train accuracy RF: {train\_accuracy\_rf}")

print(f"Test accuracy RF: {test\_accuracy\_rf}")



\# Train accuracy Decision Tree: 0.7733664185277088

\# Test accuracy Decision Tree: 0.626204238921002

\# Train accuracy RF: 0.9975186104218362

\# Test accuracy RF: 0.5202312138728323

Y exponer las features de importancia


\# Create Feature Importance plot

feature\_scores\_tree = pd.Series(tree.feature\_importances\_, index=X\_train.columns).sort\_values(ascending=False)

feature\_scores\_rf = pd.Series(rf.feature\_importances\_, index=X\_train.columns).sort\_values(ascending=False)



sns.barplot(x=feature\_scores\_tree, y=feature\_scores\_tree.index)

plt.xlabel("Importance Score")

plt.ylabel("Features")

plt.title("Features Importance Score for Decision Tree")

plt.plot()



sns.barplot(x=feature\_scores\_rf, y=feature\_scores\_rf.index)

plt.xlabel("Importance Score")

plt.ylabel("Features")

plt.title("Features Importance Score for Random Forest")

plt.plot()

Aquí se puede notar que para el Random Forest hay importancia en todas las variables en diferencia al Decision Tree

Finalmente se usará una Confussion Matrix y un Classification Report para obtener información clave de los resultados del modelo


\# Create confussion matrix

from sklearn.metrics import confusion\_matrix



confussion\_matrix\_tree = confusion\_matrix(Y\_test, y\_pred\_test\_tree)

confussion\_matrix\_rf = confusion\_matrix(Y\_test, y\_pred\_test\_rf)



confussion\_matrix\_tree



array(\[\[ 29,   0,  89,   0],

       \[  5,   0,  14,   0],

       \[ 62,   0, 296,   0],

       \[ 10,   0,  14,   0]])




confussion\_matrix\_rf



array(\[\[ 20,   0,  94,   4],

       \[  3,   0,  14,   2],

       \[ 83,  21, 247,   7],

       \[  4,   1,  16,   3]])



\# Get classification Report

from sklearn.metrics import classification\_report



\# tree report

print(classification\_report(Y\_test, y\_pred\_test\_tree))




              precision    recall  f1-score   support



         acc       0.27      0.25      0.26       118

        good       0.00      0.00      0.00        19

       unacc       0.72      0.83      0.77       358

       vgood       0.00      0.00      0.00        24



    accuracy                           0.63       519

   macro avg       0.25      0.27      0.26       519

weighted avg       0.56      0.63      0.59       519



\# rf report

print(classification\_report(Y\_test, y\_pred\_test\_rf))



              precision    recall  f1-score   support



         acc       0.18      0.17      0.18       118

        good       0.00      0.00      0.00        19

       unacc       0.67      0.69      0.68       358

       vgood       0.19      0.12      0.15        24



    accuracy                           0.52       519

   macro avg       0.26      0.25      0.25       519

weighted avg       0.51      0.52      0.51       519

Evaluación de resultados del modelo de clasificación con random forest

Introducción a árboles de decisión

¿Qué son los árboles de decisión?

Tu primer árbol de decisión con scikit-learn

Análisis de datos para tu primer árbol de decisión

Entrenamiento y evaluación de árbol de decisión con scikit-learn

¿Cómo funcionan los árboles de decisión?

¿Cuándo usar árboles de decisión?

Proyecto práctico: árboles de decisión

Conociendo problema a resolver y dataset de clasificación

Análisis exploratorio de datos para árbol de decisión

Procesamiento de datos para el entrenamiento de árbol de decisión

Entrenamiento de modelo de clasificación con árbol de decisión

¿Cómo evaluar un modelo de árbol de decisión?

Evaluación de resultados del modelo de árbol de decisión

Introducción a random forest

¿Qué son los random forest o bosques aleatorios?

Tu primer random forest con scikit-learn

Análisis de datos para tu primer random forest

Entrenamiento de tu primer modelo de random forest con scikit-learn

Evaluación de tu primer modelo de random forest con scikit-learn

¿Cómo funcionan los random forest?

¿Cuándo utilizar random forest?

Proyecto práctico: random forest

Entrenamiento de modelo de clasificación de carros con random forest

Evaluación de resultados del modelo de clasificación con random forest

Conclusión

Proyecto final y cierre

Comparte tu proyecto de Random Forest y obtén tu certificado