A mi me quedó la inquietud de por qué usamos un Decision Tree Regressor (o en general una regresion) para un problema que es de CLASIFICACION.
Entiendo que las regresiones son para problemas donde queremos calcular valores continuos. Por otra parte, los Clasificadores se usan sobre valores discretos.
Ahora bien, si el objetivo con el dataset Iris era predecir la clase de cada especie (setosa, virginica, versicolor), este output es de tipo discreto (cualitativo), por tanto, se debería haber usado un algoritmo de tipo Clasificacion (no de regresion, según entiendo).
Por ende, como en la clase usamos una regresion para “clasificar”, lo cual pienso que no es adecuado, pues esto conduce a resultados muy sospechosos o erroneos, tal como obtuvimos en la matriz de confusion (linea 28) donde todos los valores dan 1.0 (muy sospechoso…).
En el libro “Python Machine Learning” abordan el problema de clasificacion de iris mediante una regresion logistica (OJO: aunque su nombre dice regresion, éste es en realidad un algoritmo de clasificación).
Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.