Hola, seguramente notaste que el modelo aplicado resultó no ser tan bueno a la salida. Recuerda que a diferencia de muchos cursos, estamos usando un conjunto de datos recién salido del mundo real para generar el modelo, sin suficiente trabajo para poder tener la potencia inferencial necesaria.
No quiero dejar de mencionarte, que para mejorar este modelo tendrÃamos que continuar:
- Enriqueciendo el conjunto de datos para describir mejor el contexto de las variables descritas: Todos los identificadores categóricos expandirlos con sus caracterÃsticas.
- Obtener más datos, que permitan al modelo imprimir más de las interacciones que tiene la información.
Sin duda, tendrÃamos que verificar si estamos en underfitting (Necesitamos mayor cantidad de caracterÃsticas y datos) y llegar al punto de overfitting (Buscar expandir y generalizar el modelo) para ajustar y enfocarse a un modelo que generalice (Que baje su error en el set de testing)
Lo que vemos aquà es el ejemplo de como atacarÃamos la primera iteración, pero tendrÃamos que continuar hasta el punto en el que la métrica de éxito de nuestro modelo (generalmente la precisión o Exhaustividad para modelos supervisados categóricos, la R2 o medidas de error para regresiones) esté más allá de nuestro limite inferior de tolerancia.
Para saber más de esto, te recomiendo los cursos de Machine Learning de aquà mismo: Tu escuela de data science en Platzi.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.