Una forma más rapida de hacerlo es con lambda
Introducción a árboles de decisión
¿Qué son los árboles de decisión?
Tu primer árbol de decisión con scikit-learn
Análisis de datos para tu primer árbol de decisión
Entrenamiento y evaluación de árbol de decisión con scikit-learn
¿Cómo funcionan los árboles de decisión?
¿Cuándo usar árboles de decisión?
Quiz: Introducción a árboles de decisión
Proyecto práctico: árboles de decisión
Conociendo problema a resolver y dataset de clasificación
Análisis exploratorio de datos para árbol de decisión
Procesamiento de datos para el entrenamiento de árbol de decisión
Entrenamiento de modelo de clasificación con árbol de decisión
¿Cómo evaluar un modelo de árbol de decisión?
Evaluación de resultados del modelo de árbol de decisión
Quiz: Proyecto práctico: árboles de decisión
Introducción a random forest
¿Qué son los random forest o bosques aleatorios?
Tu primer random forest con scikit-learn
Análisis de datos para tu primer random forest
Entrenamiento de tu primer modelo de random forest con scikit-learn
Evaluación de tu primer modelo de random forest con scikit-learn
¿Cómo funcionan los random forest?
¿Cuándo utilizar random forest?
Quiz: Introducción a random forest
Proyecto práctico: random forest
Entrenamiento de modelo de clasificación de carros con random forest
Evaluación de resultados del modelo de clasificación con random forest
Quiz: Proyecto práctico: random forest
Conclusión
Proyecto final y cierre
Comparte tu proyecto de Random Forest y obtén tu certificado
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Aportes 10
Preguntas 3
Una forma más rapida de hacerlo es con lambda
Un análisis exploratorio de datos (EDA) implica el uso de gráficos o visualizaciones para explorar y analizar un conjunto de datos donde el objetivo es explorar, investigar y aprender mediante clasificaciones en subgrupos que hacen el análisis mas sencillo.
Un numpy.dtypes describe cómo deben interpretarse los bytes en el bloque de memoria de tamaño fijo correspondiente a un elemento de matriz.
Mientras un .head() devuelve una serie de valores seleccionados desde el principio .
No me atribuyo la idea porque no se me ocurrio a mi, pero por aprendi que con los nombres podrias extraer los apellidos y de repente poder clasificar si al pertenecer a cierta familia tu probabilidad de sobrevivir, que tu creatividad sea tu limite, siempre veras que hay muchas maneras de resolverlo
Si les sale error en el gráfico, puede deberse a que hay que decirle a barplot cuál es el eje X y cuál es el eje Y del gráfico, quedando de esta manera el código:
#Verificamos el feature importances
import seaborn as sns
importances = tree.feature_importances_
columns = X.columns
sns.barplot(x=columns,y=importances, palette = 'bright', saturation = 2.0, edgecolor = 'black', linewidth = 2)
plt.title('Importancia de cada Feature')
plt.show()
¿Para este problema de predecir la supervivencia también podría trabajarse con una regresión logísticas?
Interesante este desarrollo del proyecto. Si que estoy aprendiendo algo.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?