Una pregunta en algunos videos sobre machine learning vi que algunos sacan el Accuracy con los mismos datos de entrenamiento incluso en v...

Marco Andres Patzi Crespo

Marco Andres Patzi Crespo

Pregunta
studenthace 3 años

Una pregunta en algunos videos sobre machine learning vi que algunos sacan el Accuracy con los mismos datos de entrenamiento incluso en videos de Youtube por ejemplo

tree_one.score(X_train, y_train)

Pero leyendo los comentarios vi que algunos los sacan con los datos de validacion

tree_one.score(X_test, y_test)

Cual seria la correcta y por que?

eso me genera muchas dudas

2 respuestas
para escribir tu comentario
    Marco Andres Patzi Crespo

    Marco Andres Patzi Crespo

    studenthace 3 años

    Super, muchas gracias por la explicación Alan

    Alan Enrique Grosso Romo

    Alan Enrique Grosso Romo

    studenthace 3 años

    Ambos cálculos son validos y te ayudan a verificar la performance del modelo. Se espera que las métricas de la base Train sean mejores que de la base Test. En mi caso genero los indicadores para la base Train, Test y para una base en otro periodo de tiempo distinto a donde se entrenó el modelo. Luego comparo las métricas. Si los indicadores se caen considerablemente puede haber un problema de overfitting y habría que revisar el proceso de modelamiento.

Curso de Fundamentos Prácticos de Machine Learning

Curso de Fundamentos Prácticos de Machine Learning

Define el algoritmo adecuado de Machine Learning para solucionar un problema de tu vida cotidiana o trabajo. Aprende a clasificar problemas y define su solución mediante clasificación, agrupación o reglas de asociación. Domina los conceptos bases del Machine Learning a través de ejercicios prácticos en Python.

Curso de Fundamentos Prácticos de Machine Learning
Curso de Fundamentos Prácticos de Machine Learning

Curso de Fundamentos Prácticos de Machine Learning

Define el algoritmo adecuado de Machine Learning para solucionar un problema de tu vida cotidiana o trabajo. Aprende a clasificar problemas y define su solución mediante clasificación, agrupación o reglas de asociación. Domina los conceptos bases del Machine Learning a través de ejercicios prácticos en Python.