Hola, he estado leyendo acerca de one hot encoder ¿en que momento se utiliza enconder, onehot encoder o get dummies? Yesi utiliza get dum...

Irene

Irene

Pregunta
studenthace 5 años

Hola, he estado leyendo acerca de one hot encoder ¿en que momento se utiliza enconder, onehot encoder o get dummies? Yesi utiliza get dummies y encoder ¿a que se debe?

2 respuestas
para escribir tu comentario
    Diego González Castellanos

    Diego González Castellanos

    studenthace 3 años

    En este caso podrías omitir el encoder, puesto que posteriormente haces get_dummies que tiene una función igual.

    La idea de estas funciones es volver variables categóricas numéricas, por lo tanto es redundante para este caso.

    Carlos Daniel Pimentel Díaz

    Carlos Daniel Pimentel Díaz

    studenthace 5 años

    El Encoder se utiliza cuando tienes variables categóricas a las que necesitas convertir en variables binarias de 0 y 1. En el ejemplo, convertimos la variable sexo (que es categórica) de manera que ya no aparezca male y female sino 1 y 0, respectivamente. Así: 1.png

    Se utiliza pd.get_dummies() cuando necesitas separar las variables categóricas y convertirlas en valores binarios y crear una especie de tabla de verdad de acuerdo a los datos que contiene cada una de esas variables categóricas. Así: 2.png

Curso de Fundamentos Prácticos de Machine Learning

Curso de Fundamentos Prácticos de Machine Learning

Define el algoritmo adecuado de Machine Learning para solucionar un problema de tu vida cotidiana o trabajo. Aprende a clasificar problemas y define su solución mediante clasificación, agrupación o reglas de asociación. Domina los conceptos bases del Machine Learning a través de ejercicios prácticos en Python.

Curso de Fundamentos Prácticos de Machine Learning
Curso de Fundamentos Prácticos de Machine Learning

Curso de Fundamentos Prácticos de Machine Learning

Define el algoritmo adecuado de Machine Learning para solucionar un problema de tu vida cotidiana o trabajo. Aprende a clasificar problemas y define su solución mediante clasificación, agrupación o reglas de asociación. Domina los conceptos bases del Machine Learning a través de ejercicios prácticos en Python.