Random Forest y Gradient Boosting Trees

Clase 30 de 32 • Curso de Machine Learning Aplicado con Python

Contenido del curso

Introducción al curso

1
Introducción al curso de Machine Learning Aplicado con Python
00:56 min

Cómo definir un problema de Machine Learning

El ciclo de ingeniería de Machine Learning

6
El ciclo de Machine Learning
07:33 min

Montar un ambiente de trabajo Pydata

Preparación de los datos

Modelación y evaluación

Feature Engineering

Modelos y Evaluación más avanzada

Tomar examen

Usuario anónimo

user•

Cuando hago el cross_validate() al enviarlos a la variable results no me aparece el train_score, a qué se debe esto?

rom sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import cross_validate

forest = RandomForestRegressor(200)
results = cross_validate(forest, X, y, cv=5, scoring='r2')

results
{'fit_time': array([2.71002126, 2.78894472, 2.78960013, 2.5732379 , 2.83417106]),
 'score_time': array([0.11221123, 0.03125691, 0.03125405, 0.03124952, 0.05081439]),
 'test_score': array([0.46560367, 0.6881979 , 0.58033755, 0.40039743, 0.45769758])}

Usuario anónimo

user•

Buscando en por Google logré que la variable results retornara el train_score de la siguiente forma:

from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import cross_validate

forest = RandomForestRegressor(200)
results = cross_validate(forest, X, y, cv=5, scoring='r2', return_train_score=True)

results
{'fit_time': array([3.31588149, 3.39652395, 3.17247009, 2.58630633, 2.74490142]),
 'score_time': array([0.06250572, 0.04688048, 0.03300834, 0.01669979, 0.03125262]),
 'test_score': array([0.47217802, 0.70196215, 0.57145989, 0.39989006, 0.43831445]),
 'train_score': array([0.96205352, 0.9678154 , 0.9668593 , 0.96654798, 0.96546444])}

y así pude capturar el valor de train_score en la variable train_scores

Usuario anónimo

user•

Debes agregar el siguiente parámetro al código para que el score de train este habilitado:

results = cross_validate(forest,X,y,cv=5,scoring='r2', return_train_score = True)

Loren Johanna Vásquez Rivera

student•

Arturo Baduna

Luciano Gauchez

Alexis Alva Nuñez

Arnulfo Rojas Jimenez

Sandra Liliana Delgado Gómez

Mauricio Andrés Guerra Cubillos

Darvin Orozco

Hugo Alexander Gonzalez Bocanegra

Jhon Freddy Puentes Nuñez

María José Medina

Nelson Andrés Loyola Salas

Luis Rogelio Reyes Hernandez

Jean Paul

teacher•

Random Forest y Gradient Boosting Trees

Introducción al curso

Introducción al curso de Machine Learning Aplicado con Python

Cómo definir un problema de Machine Learning

Importancia de definir el problema en Machine Learning

Predecir el ingreso de películas de IMDB

Terminología de Machine Learning

Materiales del curso: Notebooks de Jupyter

El ciclo de ingeniería de Machine Learning

El ciclo de Machine Learning

Montar un ambiente de trabajo Pydata

Configuración del ambiente de trabajo con Google Collab

Qué es y cómo se utiliza Numpy

Arrays en Numpy

Operaciones aritméticas en Numpy

Preparación de los datos

Cargar los datos necesarios para el proyecto

Inspección de los tipos de datos

Inspección cuantitativa y de salud de los datos

Limpiar los datos

Manejo de datos faltantes

Modelación y evaluación

El objeto estimador de Scikit-Learn

Implementar un modelo de regresión (Lasso)

Ajustando Modelos de Machine Learning, Underfitting y Overfitting

Evaluando el modelo

Feature Engineering

Feedback del modelamiento

Análisis exploratorio

Continuando con el análisis exploratorio

Creación de features

Creando más features

Selección de features y la maldición de la dimensionalidad

Modelos y Evaluación más avanzada

Cross Validation

Selección de modelos

Curvas de aprendizaje

Introducción a Ensembles y Árboles de Decisión

Random Forest y Gradient Boosting Trees

Optimización de hiperparámetros

Conclusiones del curso