Introducción a árboles de decisión

1

¿Qué son los árboles de decisión?

2

Tu primer árbol de decisión con scikit-learn

3

Análisis de datos para tu primer árbol de decisión

4

Entrenamiento y evaluación de árbol de decisión con scikit-learn

5

¿Cómo funcionan los árboles de decisión?

6

¿Cuándo usar árboles de decisión?

Quiz: Introducción a árboles de decisión

Proyecto práctico: árboles de decisión

7

Conociendo problema a resolver y dataset de clasificación

8

Análisis exploratorio de datos para árbol de decisión

9

Procesamiento de datos para el entrenamiento de árbol de decisión

10

Entrenamiento de modelo de clasificación con árbol de decisión

11

¿Cómo evaluar un modelo de árbol de decisión?

12

Evaluación de resultados del modelo de árbol de decisión

Quiz: Proyecto práctico: árboles de decisión

Introducción a random forest

13

¿Qué son los random forest o bosques aleatorios?

14

Tu primer random forest con scikit-learn

15

Análisis de datos para tu primer random forest

16

Entrenamiento de tu primer modelo de random forest con scikit-learn

17

Evaluación de tu primer modelo de random forest con scikit-learn

18

¿Cómo funcionan los random forest?

19

¿Cuándo utilizar random forest?

Quiz: Introducción a random forest

Proyecto práctico: random forest

20

Entrenamiento de modelo de clasificación de carros con random forest

21

Evaluación de resultados del modelo de clasificación con random forest

Quiz: Proyecto práctico: random forest

Conclusión

22

Proyecto final y cierre

23

Comparte tu proyecto de Random Forest y obtén tu certificado

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

No se trata de lo que quieres comprar, sino de quién quieres ser. Invierte en tu educación con el precio especial

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

11 Días
2 Hrs
31 Min
49 Seg

Proyecto final y cierre

22/23
Recursos

Nombre del curso: Curso de Decision Trees y Random Forest con Python y scikit-learn
Dean: Sebastián Delmont
School Owner: Carlos Alarcón
Profesora: Layla Scheli
Dirección: Miguel Torres
Producción OPS: Lizeth Cáceres y Rocío Martínez
Producción y Edición de video: Juan Camilo Franco Hernandez
Postproducción de audio: Karen White
Diseño gráfico: Romi Lavín y Daniel Ordoñez
Coordinación General: Andrés Arizmendy, Daniel Gutiérrez, Carol Baquero, Carlos Céspedes y Sura Cedeño
Revisión: Axel Yaguana y Rodrigo Goitia

Aportes 13

Preguntas 4

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Muy buen curso ya que es practico y sienta las bases para que cada quien pueda profundizar según su criterio, además de la organización del material ya que se dispone del código ordenado que desafortunadamente en cursos anteriores no se tenia.

Otra cosa que me parece falta son las consideraciones a tener si yo despliego el modelo

las observaciones nuevas como se le pasan al modelo, en esa etapa el category_encoders como va a mapear mi nueva observación …

que pasa si se pone una categoria que el DF de train no conocía ?

test resulttadoos
Resumen
1.
¿A qué tipo de algoritmos de machine learning pertenecen los árboles de decisión?

Aprendizaje supervisado

Los modelos de árboles de decisión aprenden de los datos generando reglas de tipo:

if-else

¿Podríamos utilizar un árbol de decisión para determinar si jugar o NO una partida de tenis? Considerando diversas variables como el clima, el viento, la humedad, entre otros factores a fines.

Sí, sería de utilidad para llegar a una decisión final.

¿Para qué tipos de problemas se pueden utilizar los árboles de decisión en machine learning?

Clasificación y regresión

¿Qué método de scikit-learn se utiliza para crear un modelo de árbol de decisión enfocado en clasificación?

DecisionTreeClassifier

En un árbol de decisión, los nodos terminales son nodos:

Sin hijos.
7.
Si buscamos aplicar un algoritmo de machine learning que brinde “resultados fáciles de interpretar y de entender”, podemos hacer uso de:

Árboles de decisión

¿Para qué tipos de problemas sirve una matriz de confusión al evaluar el performance del modelo de machine learning utilizado?

Clasificación
9.
“Predije que era negativo, pero resultó positivo”. ¿A qué interpretación de la matriz de confusión hacemos referencia?

Falso negativo (FN)

“Predije que era falso y lo era”. ¿A qué interpretación de la matriz de confusión hacemos referencia?

Verdadero negativo (TN)

Al evaluar un modelo de árbol de decisión, los verdaderos positivos como negativos son _______:

Aciertos
12.
Al evaluar un modelo de árbol de decisión, los falsos negativos como positivos son _________:

Errores
13.
La métrica de evaluación de un modelo de ML conocida como ___________, en la práctica, es el % total de elementos clasificados correctamente.

Exactitud
14.
¿A qué tipo de método corresponden los bosques aleatorios o random forests?

Ensamble
15.
Los bosques aleatorios o random forests se obtienen de combinar:

Multiples árboles de decisión
16.
¿En qué tipos de problemas de machine learning se pueden usar los algoritmos de random forests?

Clasificación y regresión

Si tengo un conjunto de datos con muchos outliers, ¿es recomendable entrenar un modelo de machine learning usando árboles de decisión?

No es recomendable. Ya que se ven fuertemente influenciados por outliers y además tienden al overfitting.

¿Cuál sería una solución para evitar el overfitting al usar árboles de decisión en machine learning?

Aplicar métodos de ensamble convirtiéndolo en bosques aleatorios o random forests.

Suponiendo que se tiene un conjunto de datos muy grande y el modelo se verá expuesto continuamente a nuevas muestras de datos, ¿sería más recomendable entrenar un modelo basado en árboles de decisión o en random forests?

Random forests, ya que funcionan mejor con datasets grandes y son estables a nuevas muestras.

Ver menos

No tenía experiencia previa en Decision Trees y Random Forest, me ha gustado mucho la forma de explicar y el dominio que tiene la profe Layla de este tema 🔥💚
¡ Me encanto el curso !
Me encantó el curso y voy con el proyecto.
Buenas 👋, Algún libro que me recomienden para seguir profundizando en el tema? Propongo una segunda parte del curso para complementar los temas vistos. Quizás con un proyecto de principio a fin que trate aplicaciones más complejas de estos modelos. En lo personal haré esto último por mi cuenta *(porque el aprendizaje implica no hacer el mínimo esfuerzo, quedarnos con los conceptos de clase y simplemente estudiar para el examen)*. Dicho esto, No estaría demás hacer el ejercicio con la minuciosa guía de la profesora
Para el que tenga problemas cargado los archivos les recomiendo hacerlo desde librería `pip install ucimlrepo` `from ucimlrepo import fetch_ucirepo ` ` ` `# fetch dataset ` `census_income = fetch_ucirepo(id=20) ` ` ` `# data (as pandas dataframes) ` `X = census_income.data.features ` `y = census_income.data.targets ` ` ` `# metadata ` `print(census_income.metadata) ` ` ` `# variable information ` `print(census_income.variables) `
¡Excelente profesora! Es muy clara en su explicación.

excelente curso muy bien explicado

Gracias, me sirvió para entender algunos conceptos adicionales.

Excelente curso. La profe toma su tiempo necesario para las explicaciones y luego pasa a la práctica debidamente.

Buenos días! Estoy intentando cargar el dataset para hacer el análisis en el cuaderno de Google Colab. He descargad el zip con los archivos del dataset pero no se importarlo, dado que la extension de los archivos no es .csv, sino que es .data, .test, .names... Necesitaría alguna orientación. Saludos!