Si mis variables X son categorical y las convierto en número con labelencoder ¿es una buena practica? Ejemplo Carros Marcas, Modelo, prec...

jhon Gutierrez

jhon Gutierrez

Pregunta
studenthace 5 años

Si mis variables X son categorical y las convierto en número con labelencoder ¿es una buena practica?

Ejemplo

Carros

Marcas, Modelo, precio carro

Mazda, CX5, $34.000.000

Renault, Logan, $40.000.000

Si tomo en X marcas y Modelo para predecir precio,¿esto es bueno?

4 respuestas
para escribir tu comentario
    Luis Cuadros

    Luis Cuadros

    studenthace 5 años

    hola, claro que se debe transformar ya que los algoritmos de calculo no entienden variables categoricas te recomiendo mucho estufiar el one hot encoder con todas sus variaciones y el get dummies de pandas, ya que puedes tener variables categoricas que pueden hacer mas pesado tu algoritmo si lo trabajas con cualquier encoder o asi mismo puedes cometer errores de cardinalidad

    Luis Cuadros

    Luis Cuadros

    studenthace 5 años

    hola, los algoritmos deben tener si o si variables numericas porque sino no seria posible hacer el calculo

    Sergio Rubiano

    Sergio Rubiano

    studenthace 5 años

    Claro, pero debes tener en cuenta por ejemplo como tienes varias marcas, lo que yo haría es sacar las muestras de cada marca, para predecir el precio del carro según la marca, pasando como target la variable del precio.

    Gabriel Escribá

    Gabriel Escribá

    studenthace 5 años

    No sólo es buena práctica, a veces es necesario, ten en cuenta que la computadora procesará mejor los números, de hecho en la limpieza de datos se incluye el pasar las variables categóricas a números ( no recuerdo el curso, pero en uno de ellos hacen eso a fin de tener mejores features)

Curso Práctico de Regresión Lineal con Python

Curso Práctico de Regresión Lineal con Python

La regresión lineal es un algoritmo de aprendizaje supervisado que se utiliza en Machine Learning y estadística. Aprende la lógica detrás de este algoritmo. Usando Python, el lenguaje de programación de alto nivel y de propósito general, podrás programar de manera sencilla un algoritmo de regresión lineal para analizar datos continuos y encontrar patrones. ¡Aprende con Platzi en este curso aplicado!

Curso Práctico de Regresión Lineal con Python
Curso Práctico de Regresión Lineal con Python

Curso Práctico de Regresión Lineal con Python

La regresión lineal es un algoritmo de aprendizaje supervisado que se utiliza en Machine Learning y estadística. Aprende la lógica detrás de este algoritmo. Usando Python, el lenguaje de programación de alto nivel y de propósito general, podrás programar de manera sencilla un algoritmo de regresión lineal para analizar datos continuos y encontrar patrones. ¡Aprende con Platzi en este curso aplicado!