Usar el OrdinalEncoder de Scikit-learn para no instalar nada mas
Luego ese X se pasa en el train_test_split, tambien se podría haber hecho con el X_train y el X_test por separado pero toma mas tiempo XD
Introducción a árboles de decisión
¿Qué son los árboles de decisión?
Tu primer árbol de decisión con scikit-learn
Análisis de datos para tu primer árbol de decisión
Entrenamiento y evaluación de árbol de decisión con scikit-learn
¿Cómo funcionan los árboles de decisión?
¿Cuándo usar árboles de decisión?
Quiz: Introducción a árboles de decisión
Proyecto práctico: árboles de decisión
Conociendo problema a resolver y dataset de clasificación
Análisis exploratorio de datos para árbol de decisión
Procesamiento de datos para el entrenamiento de árbol de decisión
Entrenamiento de modelo de clasificación con árbol de decisión
¿Cómo evaluar un modelo de árbol de decisión?
Evaluación de resultados del modelo de árbol de decisión
Quiz: Proyecto práctico: árboles de decisión
Introducción a random forest
¿Qué son los random forest o bosques aleatorios?
Tu primer random forest con scikit-learn
Análisis de datos para tu primer random forest
Entrenamiento de tu primer modelo de random forest con scikit-learn
Evaluación de tu primer modelo de random forest con scikit-learn
¿Cómo funcionan los random forest?
¿Cuándo utilizar random forest?
Quiz: Introducción a random forest
Proyecto práctico: random forest
Entrenamiento de modelo de clasificación de carros con random forest
Evaluación de resultados del modelo de clasificación con random forest
Quiz: Proyecto práctico: random forest
Conclusión
Proyecto final y cierre
Comparte tu proyecto de Random Forest y obtén tu certificado
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
No se trata de lo que quieres comprar, sino de quién quieres ser. Aprovecha el precio especial.
Antes: $249
Paga en 4 cuotas sin intereses
Termina en:
Aportes 6
Preguntas 6
Usar el OrdinalEncoder de Scikit-learn para no instalar nada mas
Luego ese X se pasa en el train_test_split, tambien se podría haber hecho con el X_train y el X_test por separado pero toma mas tiempo XD
['buying', 'maint', 'doors', 'persons', 'lug_boot', 'safety']
En general, para evitar escribir las columnas y pasarlas manualmente se puede escribir el código
X_train.columns
La salida de eso será la siguiente:
Index(['buying', 'maint', 'doors', 'persons', 'lug_boot', 'safety'], dtype='object')
De ahí, se copia el primer parámetro que aparece en el output.
Esto puede funcionar para evitar escribir los atributos cada vez que se hace el procedimiento sobre un dataset que pueda tener muchos más atributos.
si les presenta error para visualizar la gráfica se arregla con el siguiente codigo:
sns.barplot(y=importances, x=columns, palette = ‘bright’, saturation = 2.0, edgecolor =‘black’, linewidth = 2)
espero les sirva.
El código de la clase:
#Importante: todos nuestros tipos de datos son object, realizamos una transformacion
!pip install category-encoders
import category_encoders as ce
**
cols = ['buying', 'maint', 'doors', 'persons','lug_bot', 'safety']
encoder = ce.OrdinalEncoder(cols = ['buying', 'maint', 'doors', 'persons','lug_bot', 'safety'])
X_train = encoder.fit_transform(X_train)
X_test = encoder.transform(X_test)
**
#Verificamos la transformacion
X_train.head ()
**
#Importar árbol de decisión
from sklearn.tree import DecisionTreeClassifier
#Creacion del modelo
tree = DecisionTreeClassifier(max_depth=2 , random_state= 0)
**
#Entrenamiento
tree.fit(X_train, Y_train)
**
#Calculo de las predicciones en Train y Test
Y_train_pred_tree = tree.predict(X_train)
Y_test_pred_tree = tree.predict(X_test)
**
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?