Entrenamiento de modelo de clasificación de carros con random forest

Clase 20 de 23 • Curso de Decision Trees y Random Forest con Python y scikit-learn

Contenido del curso

Introducción a árboles de decisión

Proyecto práctico: árboles de decisión

Introducción a random forest

Proyecto práctico: random forest

20
Entrenamiento de modelo de clasificación de carros con random forest
Viendo ahora
21
Evaluación de resultados del modelo de clasificación con random forest
11:34 min

Conclusión

Tomar examen

Comentarios

Sebastián Franco

student•

Ahora se usará el dataset de cars con el algoritmo de Random Forest


\# train car dataset with Random Forest

from sklearn.ensemble import RandomForestClassifier



rf = RandomForestClassifier(n\_estimators=10, random\_state=42)

rf.fit(X\_train, Y\_train)



y\_pred\_train\_rf = rf.predict(X\_train)

y\_pred\_test\_rf = rf.predict(X\_test)

Mario Alexander Vargas Celis

student•

Aquí tienes un ejemplo completo de entrenamiento de un modelo de clasificación de carros usando Random Forest en Python con scikit-learn, desde los datos hasta la predicción:

✅ Supongamos que tienes un dataset con las siguientes columnas:

marca, anio, cilindraje, tipo_combustible, precio_categoria (donde esta última es la variable objetivo: "alto", "medio", "bajo")

📦 1. Importar librerías

import pandas as pd from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split from sklearn.preprocessing import LabelEncoder from sklearn.metrics import classification_report, confusion_matrix

📄 2. Datos de ejemplo

# Datos simulados data = { 'marca': ['Toyota', 'Mazda', 'Renault', 'Chevrolet', 'Kia'], 'anio': [2015, 2018, 2020, 2017, 2016], 'cilindraje': [1.6, 2.0, 1.2, 1.4, 1.6], 'tipo_combustible': ['Gasolina', 'Gasolina', 'Gasolina', 'Diesel', 'Gasolina'], 'precio_categoria': ['medio', 'alto', 'bajo', 'medio', 'bajo'] } df = pd.DataFrame(data)

🧹 3. Preprocesamiento

# Codificación de variables categóricas le_marca = LabelEncoder() le_comb = LabelEncoder() le_target = LabelEncoder()

df['marca'] = le_marca.fit_transform(df['marca']) df['tipo_combustible'] = le_comb.fit_transform(df['tipo_combustible']) df['precio_categoria'] = le_target.fit_transform(df['precio_categoria']) # Etiquetas 0, 1, 2

✂️ 4. División en train/test

X = df.drop('precio_categoria', axis=1) y = df['precio_categoria']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=42)

🌲 5. Entrenamiento del modelo Random Forest

model = RandomForestClassifier(n_estimators=100, random_state=42) model.fit(X_train, y_train)

🧪 6. Evaluación del modelo

y_pred = model.predict(X_test)

print("Matriz de confusión:") print(confusion_matrix(y_test, y_pred)) print("\nReporte de clasificación:") print(classification_report(y_test, y_pred, target_names=le_target.classes_))

🧠 7. Predecir nuevos autos

nuevo_auto = pd.DataFrame({ 'marca': le_marca.transform(['Toyota']), 'anio': [2022], 'cilindraje': [1.8], 'tipo_combustible': le_comb.transform(['Gasolina']) })

pred = model.predict(nuevo_auto) print(f"Categoría de precio predicha: {le_target.inverse_transform(pred)[0]}")

Ronald Andrey Beltran Parada

student•

Excelente profe

Piero Olivas

student•

Excelente! 👩🏻💻

Layla Scheli

teacher•

Gracias Piero :)

\# train car dataset with Random Forest

from sklearn.ensemble import RandomForestClassifier

rf = RandomForestClassifier(n\_estimators=10, random\_state=42)

rf.fit(X\_train, Y\_train)

y\_pred\_train\_rf = rf.predict(X\_train)

y\_pred\_test\_rf = rf.predict(X\_test)

Entrenamiento de modelo de clasificación de carros con random forest

Introducción a árboles de decisión

¿Qué son los árboles de decisión?

Tu primer árbol de decisión con scikit-learn

Análisis de datos para tu primer árbol de decisión

Entrenamiento y evaluación de árbol de decisión con scikit-learn

¿Cómo funcionan los árboles de decisión?

¿Cuándo usar árboles de decisión?

Proyecto práctico: árboles de decisión

Conociendo problema a resolver y dataset de clasificación

Análisis exploratorio de datos para árbol de decisión

Procesamiento de datos para el entrenamiento de árbol de decisión

Entrenamiento de modelo de clasificación con árbol de decisión

¿Cómo evaluar un modelo de árbol de decisión?

Evaluación de resultados del modelo de árbol de decisión

Introducción a random forest

¿Qué son los random forest o bosques aleatorios?

Tu primer random forest con scikit-learn

Análisis de datos para tu primer random forest

Entrenamiento de tu primer modelo de random forest con scikit-learn

Evaluación de tu primer modelo de random forest con scikit-learn

¿Cómo funcionan los random forest?

¿Cuándo utilizar random forest?

Proyecto práctico: random forest

Entrenamiento de modelo de clasificación de carros con random forest

Evaluación de resultados del modelo de clasificación con random forest

Conclusión

Proyecto final y cierre

Comparte tu proyecto de Random Forest y obtén tu certificado