
jhon Gutierrez
PreguntaSi mis variables X son categorical y las convierto en número con labelencoder ¿es una buena practica?
Ejemplo
Carros
Marcas, Modelo, precio carro
Mazda, CX5, $34.000.000
Renault, Logan, $40.000.000
Si tomo en X marcas y Modelo para predecir precio,¿esto es bueno?
Luis Cuadros
hola, claro que se debe transformar ya que los algoritmos de calculo no entienden variables categoricas te recomiendo mucho estufiar el one hot encoder con todas sus variaciones y el get dummies de pandas, ya que puedes tener variables categoricas que pueden hacer mas pesado tu algoritmo si lo trabajas con cualquier encoder o asi mismo puedes cometer errores de cardinalidad
Luis Cuadros
hola, los algoritmos deben tener si o si variables numericas porque sino no seria posible hacer el calculo

Sergio Rubiano
Claro, pero debes tener en cuenta por ejemplo como tienes varias marcas, lo que yo haría es sacar las muestras de cada marca, para predecir el precio del carro según la marca, pasando como target la variable del precio.
Gabriel Escribá
No sólo es buena práctica, a veces es necesario, ten en cuenta que la computadora procesará mejor los números, de hecho en la limpieza de datos se incluye el pasar las variables categóricas a números ( no recuerdo el curso, pero en uno de ellos hacen eso a fin de tener mejores features)