Clasificación VS Clusterización
Tomado de: https://blog.bismart.com/es/la-clasificación-y-la-clusterización-una-explicación-práctica
Programación probabilística
Introducción a la programación probabilística
Probabilidad condicional
Teorema de Bayes
Entiende el Teorema de Bayes
Análisis de síntomas
Aplicaciones del Teorema de Bayes
Mentiras estadísticas
Garbage in, garbage out
Imágenes engañosas
Cum Hoc Ergo Propter Hoc
Prejuicio en el muestreo
Falacia del francotirador de Texas
Porcentajes confusos
Falacia de regresión
Introducción a Machine Learning
Introducción a Machine Learning
Feature vectors
Métricas de distancia
Agrupamiento
Introducción al agrupamiento
Agrupamiento jerárquico
Agrupamiento K-means
Otras técnicas de agrupamiento
Clasificación
Introducción a la clasificación
Clasificación K-nearest neighbors
Otras tecnicas de clasificación
Conclusiones
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
David Aroesti
Aportes 27
Preguntas 2
Clasificación VS Clusterización
Tomado de: https://blog.bismart.com/es/la-clasificación-y-la-clusterización-una-explicación-práctica
Resumen: El clustering lo usamos cuando no tenemos ni idea de que clase de grupos puede haber dentro del dataset, entonces necesitamos que nuestro algoritmo genere esos grupos. Y la clasificacion la usamos cuando nosotros sabemos que grupo necesitamos y queremos que nuestro algoritmo nos diga que datos son los que estan dentro de este grupo.
Puede que me haya equivocado jajaja
En esta imagen se ve paso a paso lo que realizamos con los daos en ML 😃
Clasificación y agrupamiento:
Notas:
La clasificación es el modelo el cual predice la clase de cierto dato.
-Es de aprendizaje supervisado, lo que quiere decir que usa etiquetas(labels) y un modelo de aprendizaje.A diferencia de el agrupamiento que es todo lo contrario, partimos del data set y no usamos etiquetas.
Pasos de la clasificación:
1.Aprendizaje(Creación del data set)
2.Clasificación
Dato:
Las redes neuronales funcionan en un modelo de agrupamiento y clasificación.
Aprendizaje no supervisado = Encuentra clusters. Se parte con un dataset.
Aprendizaje supervisado = Clasificar objetos en base a una linea/curva arbitraria asignada. Siempre se necesita generar un modelo y luego realizar la clasificación
Diferencias entre clasificación y agrupamiento
La clasificación se utiliza para el aprendizaje supervisado, mientras que el agrupamiento se utiliza para el aprendizaje no supervisado.
El proceso de clasificar las instancias de entrada en función de sus etiquetas de clase correspondientes se conoce como clasificación, mientras que agrupar las instancias en función de su similitud sin la ayuda de etiquetas de clase se conoce como agrupación.
Como la clasificación tiene etiquetas, es necesario entrenar y probar el conjunto de datos para verificar el modelo creado, pero no es necesario entrenar y probar el conjunto de datos en la agrupación.
La clasificación es más compleja en comparación con la agrupación, ya que hay muchos niveles en la fase de clasificación, mientras que en la agrupación solo se realiza la agrupación.
Los ejemplos de clasificación son regresión logística, clasificador Naive Bayes, máquinas de vectores de soporte, etc. Mientras que los ejemplos de agrupación son el algoritmo de agrupación de k-medias, el algoritmo de agrupación de c-medias difuso, el algoritmo de agrupación de Gauss (EM), etc.
Fuente: geeks for geeks
En esta imagen se ve la diferencia entre los tipos de métodos supervisados y los métodos no supervisados.
Clasificación
Son algoritmos de aprendizaje supervisado puesto que necesitamos etiquetas (labels) para generar un modelo que se adecúe a estas y a partir de este modelo predecimos a qué clase pertenece cierto dato.
Nota:
Un ejemplo de aprendizaje supervisado es Google Fotos donde te pregunta por los datos de algunas fotos y a partir de esta información clasifica todas las demás.
clasificación y agrupación? Aquí una ayuda
fuente: https://es.acervolima.com/ml-clasificacion-vs-agrupacion/
Aprendizaje Supervisado
CLASIFICACIÓN
Aprendizaje No Supervisado
CLUSTERING
Buen Video para aportar información de Aprendizaje Supervisado vd No Supervisado
https://www.youtube.com/watch?v=7saDlsTCG5o
Comparto mis NOTAS:
La clasificación es el proceso por el cual se predice la clase de cierto dato.
Es un tipo de prendizaje supervisado ya que para que funcione se necesitan etiquetas con los datos (Labels).
Se utiliza en muchos dominios ,incluyendo la medicina, aprobacion crediticia, entre otros.
Sigue dos pasos:
-Aprendizaje (creación del modelo)
-Clasificación.
Parte desde el supuesto que nosotros ya tenemos informacion
Diferencias:
*Aprendizaje no supervisado:
_Clusters.
_Puede partir on el data science.
*Aprendizaje supervisado:
_Clasificación.
_Primero se genera un modelo y luego se clasifica.
En un cluster por que se dice que no hay etiqueta?? … igual puedo etiquetar a posteriori no?? o sea … en el mismo ejemplo del video dice:
cluster 1: low risk factor.
cluster 2: high risk factor.
eso podrían ser etiquetas no??? y están tanto en el agrupamiento como en la clasificación.
tengo esa duda.
Recomiendo este video
https://www.youtube.com/watch?v=EZOab1vkFmI
El clusteting, es más descomplicado a la hora de tratar con los datos, pero el de clasificación, necesita primero que se le enseñe, osea generar un modelo, para que este pueda clasificar.
La diferencia entre supervisado y no supervisado, es que el primero, ya viene agrupado y el segundo agrupa por diversos cálculos. Los dos buscan agrupar futuros datos, pero aprenden de manera distinta.
Cabe recalcar que existen los algoritmos de semi supervisión, en los que no necesitamos más de uno o dos datos, para que el algoritmo pueda clasificar los datos de una forma casi que 100% efectiva.
Para este tipo de técnicas, tenemos que generar primero el modelo y luego hacer la clasificación de un dato sin la etiqueta.
Todo el objetivo de la clasificación, es determinar a qué grupo, pertenece un dato que no conocemos.
Otra rama de los algoritmos de Machine Learning, es la de clasificación, con la que entrenamos asistidamente a nuestro algoritmo.
Introducción a la clasificación.
Introducción a la clasificación
Si quedo claro la diferencia entre estos dos tipos de aprendizaje.
Entendería que frente a un conjunto grande de datos se usa primero clusterización para conocer sus patrones y luego se puede utilizar clasificación con una información e hipótesis previa.
¿Puede considerarse así?
Artículo para saber cuando usar cada uno 😃 :
https://www.dotactiv.com/blog/classification-vs-clustering
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?