Hola chicos! es muy importante que entendamos estas metricas, no solo para saber evaluar nuestros modelos de clasificacion, si no para hacerlo en funcion del modelo de negocio o de nuestro problema a resolver, al final las metricas son las que nos indican si el modelo tiene sentido con la realidad.
Un ejemplo muy util es saber evaluar el modelo de clasifiacacion con datos desbalanceados, donde podemos inducirnos al error por ver un accuracy de 90% y decimos eureca, y en la realidad no funciona nuestro modelo, pero porque?
Pues por que olvidamos ver la precision y el recall, para aterrizar mas esto podemos ver nuestro proyecto que cuenta con al rededor de 1700 datos en total y con 4 clases(unacc,acc,good,vgood) la clase unacc tiene 1210 datos, osea que arrastra el 70% de los datos, si evaluamos solo el accuracy podemos ver un modelo que llegue quizas al 80%, pero si evaluamos la precision y el recall para cada clase podriamos ver como la clase con mas datos tiene buenas metricas pero las demas no, enmascarando la supuesta generalizacion de nuestro modelo y exponiendo su mal performance quizas debido a las clases con menos datos. entonces ahi es donde comienza nuestro trabajo como Data scientist.
y tranquilos, si tienen dudas sobre esto o quieren dicutirlo, leo sus comentarios
saludos!
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?