
Marco Andres Patzi Crespo
PreguntaUna pregunta en algunos videos sobre machine learning vi que algunos sacan el Accuracy con los mismos datos de entrenamiento incluso en videos de Youtube por ejemplo
tree_one.score(X_train, y_train)
Pero leyendo los comentarios vi que algunos los sacan con los datos de validacion
tree_one.score(X_test, y_test)
Cual seria la correcta y por que?
eso me genera muchas dudas

Marco Andres Patzi Crespo
Super, muchas gracias por la explicación Alan
Alan Enrique Grosso Romo
Ambos cálculos son validos y te ayudan a verificar la performance del modelo. Se espera que las métricas de la base Train sean mejores que de la base Test. En mi caso genero los indicadores para la base Train, Test y para una base en otro periodo de tiempo distinto a donde se entrenó el modelo. Luego comparo las métricas. Si los indicadores se caen considerablemente puede haber un problema de overfitting y habría que revisar el proceso de modelamiento.