Introducción a árboles de decisión

1

¿Qué son los árboles de decisión?

2

Tu primer árbol de decisión con scikit-learn

3

Análisis de datos para tu primer árbol de decisión

4

Entrenamiento y evaluación de árbol de decisión con scikit-learn

5

¿Cómo funcionan los árboles de decisión?

6

¿Cuándo usar árboles de decisión?

Quiz: Introducción a árboles de decisión

Proyecto práctico: árboles de decisión

7

Conociendo problema a resolver y dataset de clasificación

8

Análisis exploratorio de datos para árbol de decisión

9

Procesamiento de datos para el entrenamiento de árbol de decisión

10

Entrenamiento de modelo de clasificación con árbol de decisión

11

¿Cómo evaluar un modelo de árbol de decisión?

12

Evaluación de resultados del modelo de árbol de decisión

Quiz: Proyecto práctico: árboles de decisión

Introducción a random forest

13

¿Qué son los random forest o bosques aleatorios?

14

Tu primer random forest con scikit-learn

15

Análisis de datos para tu primer random forest

16

Entrenamiento de tu primer modelo de random forest con scikit-learn

17

Evaluación de tu primer modelo de random forest con scikit-learn

18

¿Cómo funcionan los random forest?

19

¿Cuándo utilizar random forest?

Quiz: Introducción a random forest

Proyecto práctico: random forest

20

Entrenamiento de modelo de clasificación de carros con random forest

21

Evaluación de resultados del modelo de clasificación con random forest

Quiz: Proyecto práctico: random forest

Conclusión

22

Proyecto final y cierre

23

Comparte tu proyecto de Random Forest y obtén tu certificado

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Análisis de datos para tu primer árbol de decisión

3/23
Recursos

Aportes 10

Preguntas 3

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Una forma más rapida de hacerlo es con lambda

Un análisis exploratorio de datos (EDA) implica el uso de gráficos o visualizaciones para explorar y analizar un conjunto de datos donde el objetivo es explorar, investigar y aprender mediante clasificaciones en subgrupos que hacen el análisis mas sencillo.

Un numpy.dtypes describe cómo deben interpretarse los bytes en el bloque de memoria de tamaño fijo correspondiente a un elemento de matriz.

Mientras un .head() devuelve una serie de valores seleccionados desde el principio .

No me atribuyo la idea porque no se me ocurrio a mi, pero por aprendi que con los nombres podrias extraer los apellidos y de repente poder clasificar si al pertenecer a cierta familia tu probabilidad de sobrevivir, que tu creatividad sea tu limite, siempre veras que hay muchas maneras de resolverlo

Siempre lo mejor queda de último: usar jupyter-notebook
Me encanto tu forma de explicar!
No es el objetivo analizar el Fare pero si esta bueno conocer que existen 15 valores que son = 0 . `# Filtra las filas donde 'Fare' es igual a cerovalores_cero = df_copy[df_copy['Fare'] == 0]` `# Imprime la cantidad de valores y la información de 'Pclass'` `print("Cantidad de valores igual a cero en 'Fare':", len(valores_cero),"\n")` `print("Información de 'Pclass' para esos valores:\n")` `print(valores_cero[['Pclass', 'Fare']])` Cantidad de valores igual a cero en 'Fare': 15 Información de 'Pclass' para esos valores: Pclass Fare 178 3 0.0 261 1 0.0 269 3 0.0 275 2 0.0 300 3 0.0 411 2 0.0 463 2 0.0 478 2 0.0 594 3 0.0 630 1 0.0 671 2 0.0 728 2 0.0 802 1 0.0 811 1 0.0 818 1 0.0

Si les sale error en el gráfico, puede deberse a que hay que decirle a barplot cuál es el eje X y cuál es el eje Y del gráfico, quedando de esta manera el código:

#Verificamos el feature importances
import seaborn as sns

importances = tree.feature_importances_
columns = X.columns
sns.barplot(x=columns,y=importances, palette = 'bright', saturation = 2.0, edgecolor = 'black', linewidth = 2)
plt.title('Importancia de cada Feature')
plt.show()

¿Para este problema de predecir la supervivencia también podría trabajarse con una regresión logísticas?

Yo lo resolví en una sola línea de código: ```python data['Sex'] = data['Sex'].map({'male': 1, 'female': 0}) ``` Me dio este resultado ![](https://static.platzi.com/media/user_upload/image-5a2a39c1-364c-4f40-a53a-492cffd7bd97.jpg)

Interesante este desarrollo del proyecto. Si que estoy aprendiendo algo.