Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Análisis de correlación de los datos

12/17
Recursos

Aportes 7

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Hago un aporte, utilice estas dos lineas de código para poder sacar nuestras variables numéricas y categoricas por separado pensado en el futuro cuando nos encontremos con dataset que tengas muchas variables, espero que les sirva a todos:

  • creo una variable cols_numerica y en ella almaceno una lista comprimida que evaluara si mi columna es numerica o flotante

  • creo una variable cols_categorica y en ella almaceno una lista comprimida que evaluara si mi columna es de tipo object

cols_numericas = [colname for colname in df.columns if df[colname].dtype in ['int64', 'float64']]

cols_categoricas = [colname for colname in df.columns if df[colname].dtype in ['object']]

Cuando se quiere llevar un modelo creado a producción en forma de APP por ejemplo, es necesario tener una columna de cada una de las variables categóricas, ya que por ejemplo si un usuario desea seleccionar un dato en específico para hacer una predicción .este debe en encontrarse dentro de los datos del modelos

Luego de pasar a dummies encontre una alta correlacion entre fumar y cargos 0.79

Por otra parte, no encontre correlacion entre region y fumador.

hola comunidad

dividí la variable charges en 3 y después tome solo la primera parte y obtuve una mejor correlacion

Matriz de correlaciones con todas las variabes:

Otra forma de obtener la correlación:

numeric_cols = ['age', 'bmi', 'children', 'charges']

sns.set(font_scale=1.5)
# Configuracion del heatmap
sns.heatmap(df[numeric_cols].corr(), cbar=True, annot=True, yticklabels=numeric_cols, xticklabels=numeric_cols)
plt.show() 

La data age - charges presenta 3 posibles grupos, lo que haria es utilizar otro modelo de ML para estos dos valores y evaluar si se puede crear 3 grupos o si surgen mas grupos. Igual con age-bmi podria surgir agrupaciones que no se pueden apreciar