Otras tecnicas de clasificación

23/24

Lectura

La clasificación es un tipo de Machine Learning supervisado. Esto significa que para entrenar un modelo necesitamos un conjunto de datos (dataset) que ya tenga etiquetas (labels) para poder entrenar nuestros modelos.

La mejor forma de pensar en algoritmos de clasificación es pensar en el sombrero clasificador de Harry Potter. Cuando un nuevo alumno de Hogwarts entra a la escuela es necesario asignarlo/clasificarlo en una de las 4 casas. El sombrero obtiene los datos cuando se lo coloca el alumno y define cuál es el mejor match para su caso particular. Aquí estamos asumiendo que el sombrero es un algoritmo que ya ha sido entrenado y que los alumnos son nuevos data points que tienen que ser clasificados.

...

Regístrate o inicia sesión para leer el resto del contenido.

Aportes 38

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

En este video explican las regresion logistica
https://www.youtube.com/watch?v=KN167eUcvrs

Aqui hay mas recursos para revisar otras tecnicas de clasificación:

https://bookdown.org/content/2274/metodos-de-clasificacion.html

Este era el que más me costaba entender, pero esta imagen me aclaró todo.

Gracias por la documentación.
Muy buena; https://scikit-learn.org/stable/modules/linear_model.html

Viendo todo esto me surgió una curiosidad & observación:
¿Creen ustedes que los test de personalidades como los de 16 personalities se basan precisamente en estos tipos de clasificación? Mientras leía Nearest Neighbour me pareció que así es exactamente como determinan qué tipo de personalidad es la que todos tienen (Curioso, ya que si eso es verdadero, al principio literalmente tuvieron que haber probado y verificar con personas presenciales que así mismo sean sus personalidades). Les comparto el link si no lo han visto para que ustedes se puedan convertir en parte de ese experimento =)
.
https://www.16personalities.com/es/test-de-personalidad

Técnicas de Clasificación
Clasificadores Lineales
Dividen el conjunto mediante líneas (puede ser multidimensional) en áreas en las que se encuentran nuestros datos. Tienen la desventaja de ser poco flexibles y hay conjuntos que no pueden ser separados por simples líneas (pero sí con polígonos)
Regresión logística
Divide el campo en un gradiente de probabilidades de pertenencia. Generan un área difusa en la que no estamos seguros de la clasificación y otra en la que tenemos un alto grado de certeza
Nearest Neighbor
Compara los datos aquellos más cercanos que ya conocemos y define la pertenencia a un grupo en base es estos. Estos algoritmos dibujan una especie de línea costera para clasificar los datos. Mientras más grande k esta línea se alisa.
Super Vector Machines
Estos algoritmos pueden generar figuras complejas (polígonos) para agrupar los datos. Son una buena opción para distribuciones de datos complejas.
Árboles de decisión
Generamos un árbol el cual recorreremos a medida que tomamos decisiones en cada nivel.

hay un curso dedicado a cada uno de los tipos de Modelo de clasificación?

Compañeros, les comparto un blog donde hablan un poco más sobre los Support Vector Machines

Enlace

scikit-learn esta increíble ya quiero aprender a usarlo¡¡¡

Acá encontré un link que muestra otros tipos de algoritmos de ML
https://www.apd.es/algoritmos-del-machine-learning/

Y en GitHub hay muchísimo contenido de valor sobre estos temas

Muy buen resumen de las clasificaciones, y la documentación muy buena.

Supongo que estos temas se profundizan en los cursos mas avanzados de Machine Learning dentro del Learning path no?

Al igual que en los algoritmos de agrupación, en los de clasificación también tenemos la posibilidad de usar más de un algoritmo para obtener mejores resultados y este dependerá también de cual es tu necesidad.

Gracias, está bueno el artículo

"Utilizamos mentalmente estructuras de árbol de decisión constantemente en nuestra vida diaria sin darnos cuenta:

¿Llueve? => lleva paraguas. ¿Soleado? => lleva gafas de sol. ¿estoy cansado? => toma café. (decisiones del tipo IF THIS THEN THAT)

Los árboles de decisión tienen un primer nodo llamado raíz (root) y luego se descomponen el resto de atributos de entrada en dos ramas (podrían ser más, pero no nos meteremos en eso ahora) planteando una condición que puede ser cierta o falsa. Se bifurca cada nodo en 2 y vuelven a subdividirse hasta llegar a las hojas que son los nodos finales y que equivalen a respuestas a la solución: Si/No, Comprar/Vender, o lo que sea que estemos clasificando."

Tomado de https://www.aprendemachinelearning.com/arbol-de-decision-en-python-clasificacion-y-prediccion/

Les comparto apuntes donde he adjuntado algunos gráficos a esta explicación para poder visualizar los algoritmos

https://github.com/francomanca93/Escuela-DataScience/blob/master/introduccion-al-pensamiento-probabilistico/README.md#otras-tecnicas-de-clasificación

Dejo mi aporte con este enlace, donde podrás encontrar más información y ejercicios para practicar.
https://www.aprendemachinelearning.com/que-es-machine-learning/

No se porque pero me recordó a esta película:
https://www.youtube.com/watch?v=eyuNrm4VK2w

Excelente documentacion, muestra todos los tipos de aprendizaje tanto supervisados como no supervisados.

Gracias por esa gran documentación!

Está excelente la documentación de Scikit-learn.

Muy buena información

interesante

Gracias profe David y Platzi! Estoy aprendiendo mucho y está gustando más y más este tema! Gracias nuevamente! Y también les agradezco a todos por compartir sus ideas y aportes!

Gracias

Gracias por el artículo, David. El curso es súper interesante y la manera de explicarlo fue muy fluida.

Me ha gustado mucho el curso. ¡gracias David y team Platzi!

Hola, una pregunta si yo quiero que algo aprenda mediante sus errores cuales tecnicas podria usar?, se que la pregunta no es muy especifica y que se necesitaria conocer mejor el problema y eso,simplemente se me ocurrio esa pregunta.

Otras técnicas de clasificación.

  • La clasificación es ML supervisado (ocupa etiquetas). El sobrero clasificador de HP es un ejemplo si fuera un algoritmo 🎩
  • Hay varios tipos:
    • Clasificadores lineales: Divide los datos con una línea (o hiperplano de dimensión N-1). Solo es útil cuando los grupos están claramente separados 2️⃣.
    • Regresión logística: Similar a los lineales pero no usan una línea, si no un gradiente de probabilidad 🎲.
    • Nearest neighbor: Se apoyan en datos ya clasificados. El mas común es el que ya revisamos. Si visualizáramos como se separa el espacio con cada K, se vería como una costa (una playa) y a mas grande K, se parecería mas a una línea 🏖️.
    • Support vector machines: Tienen la habilidad de generar figuras complejas (polígonos) para agrupa
    • Árboles de decisión: Se recorre el árbol y en cada nodo se toma una decisión 🌲.
  • La calidad de los datos de entrenamiento son determinantes en la calidad de los algoritmos de clasificación.

User guide: contents - scikit-learn 0.24.1 documentation

Gracias por la documentación compartida, es un gran complemento para el camino del ML

gracias por compartir los diferentes algoritmos.

Gran complemento a las clases previas

Muy buena síntesis!!

buenisimo
gracias!

gracias

Gracias David

interesante documentación.