Random Forest
Bosques aleatorios en sklearn (RandomForestClassifier y RandomForestRegressor), cada árbol del conjunto se construye a partir de una muestra de arranque del conjunto de entrenamiento.
.
Al dividir cada nodo durante la construcción de un árbol, la mejor división se encuentra entre todas las características de entrada o un subconjunto aleatorio de tamaño max_features(en sklearn).
.
El propósito es disminuir la varianza del estimador forest. Los árboles de decisión individuales suelen exhibir una gran variación y tienden a sobreajustarse.
.
En la práctica, la reducción de la varianza suele ser significativa, por lo que genera un mejor modelo general.
La implementación de scikit-learn combina clasificadores promediando su predicción probabilística, en lugar de permitir que cada clasificador vote por una sola clase.
Fuente doc sklearn: https://scikit-learn.org/stable/modules/ensemble.html#random-forests
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?