¿Cómo se hace todo esto pero con datos cualitativos es decir de tipo object?

Andrea Otero Cano

Andrea Otero Cano

Pregunta
student
hace 7 años

¿Cómo se hace todo esto pero con datos cualitativos es decir de tipo object?

7 respuestas
    Pablo Fernández

    Pablo Fernández

    student
    hace 7 años

    Supongo que te tendras que buscar la vida para pasar ese tipo de datos cualitativos a unos cuantitativos. A mi se me ocurre trabajar con exadecimal o algo por el estilo.

    Jean Paul

    Jean Paul

    teacher
    hace 7 años

    Te refieres a trabajar con strings? Hay metodos de featurizacion con strings como por ejemplo:

    • TF-IDF
    • Word2Vec
    Darvin Orozco

    Darvin Orozco

    student
    hace 6 años

    Muy buena pregunta la que haces! Me surge la siguiente pregunta, ¿Entonces sólo es posible "predecir" lo que se cuantifica?

    David Rueda

    David Rueda

    student
    hace 6 años

    Al principio se observaron 4 posibles soluciones que aborda el machine learning, para los modelos supervisados se pueden obtener 2 resultados regresiones y características. Independientemente del objetivo requerido (targets o Y) se deben convertir a números, y al final, los modelos entregarán números que en el caso de las regresiones serán valores continuos y en el otro caso esos números representarán categorías.

    Luis Fernando Úbeda Camacho

    Luis Fernando Úbeda Camacho

    student
    hace 6 años

    **Si se puede **tener en cuenta las variables categóricas para ayudar en una predicción numérica. El proceso de convertir variables categóricas a numéricas se le conoce como variable dummies, se puede hacer con pandas.

    **pd.get_dummies() ** Esta función convierte a numéricas las variables categóricas. Un ejemplo seria, como cuando quieres utilizar una variable como sexo para ayudar a la predicción, tenemos los valores 'F' de female y 'M' male en la variable sexo. Lo que hará pd.get_dummies() sera crear dos nuevas variables, una para female y otra para male y estaran formadas por 0 y 1. Por ejemplo si es un hombre el valor de la variable para es fila será female = 0 y male = 1 De esta manera se puede utilizar una variable categórica como el sexo, ya que influye mucho en las predicciones.

    Luis Ariosto Serna Cardona

    Luis Ariosto Serna Cardona

    student
    hace 5 años

    Buenas tardes, para responder tanto a AndreOtero, como darvin.

    Darvin, si, realmente todo estos algoritmo están diseñados para datos cuantitativos. Pero, esto no quiere decir que los datos cualitativos no se puedan trabajar, Python y los demás lenguajes, permiten hacer un embebimiento o codificación, como desees llamarlo. lo que hace, es convertir estos tipos de datos categóricos (cualitativos) a datos cuantitativos. un ejemplo seria, One Hot encoding, Binary encoding, etc. obviamente, cada uno tiene su restricción. ¿por qué? los datos categóricos tienen dos tipos de codificaciones, ordinales y nominales. Los nominales son los que mas nos pueden complicar... sin embargo, tiene sus soluciones, un poco mas complejas pero viables.
    tengo varios artículos Q1 y Q2 de mi autoría que les podrían servir para el estudio pertinente, si así lo desearan.

Curso de Machine Learning con Python

Curso de Machine Learning con Python

Aplica algoritmos de Machine Learning de forma simple y eficiente con Scikit-Learn. Utiliza herramientas para análisis y minería de datos implementando esta librería en tus proyectos.

Curso de Machine Learning con Python
Curso de Machine Learning con Python

Curso de Machine Learning con Python

Aplica algoritmos de Machine Learning de forma simple y eficiente con Scikit-Learn. Utiliza herramientas para análisis y minería de datos implementando esta librería en tus proyectos.