No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Introducción a la clasificación

21/24
Recursos

Aportes 24

Preguntas 1

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

En esta imagen se ve paso a paso lo que realizamos con los daos en ML 😃

Resumen: El clustering lo usamos cuando no tenemos ni idea de que clase de grupos puede haber dentro del dataset, entonces necesitamos que nuestro algoritmo genere esos grupos. Y la clasificacion la usamos cuando nosotros sabemos que grupo necesitamos y queremos que nuestro algoritmo nos diga que datos son los que estan dentro de este grupo.
Puede que me haya equivocado jajaja

Clasificación y agrupamiento:

Notas:
La clasificación es el modelo el cual predice la clase de cierto dato.
-Es de aprendizaje supervisado, lo que quiere decir que usa etiquetas(labels) y un modelo de aprendizaje.A diferencia de el agrupamiento que es todo lo contrario, partimos del data set y no usamos etiquetas.
Pasos de la clasificación:
1.Aprendizaje(Creación del data set)
2.Clasificación
Dato:
Las redes neuronales funcionan en un modelo de agrupamiento y clasificación.

Aprendizaje no supervisado = Encuentra clusters. Se parte con un dataset.
Aprendizaje supervisado = Clasificar objetos en base a una linea/curva arbitraria asignada. Siempre se necesita generar un modelo y luego realizar la clasificación

En esta imagen se ve la diferencia entre los tipos de métodos supervisados y los métodos no supervisados.

Clasificación
Son algoritmos de aprendizaje supervisado puesto que necesitamos etiquetas (labels) para generar un modelo que se adecúe a estas y a partir de este modelo predecimos a qué clase pertenece cierto dato.

Nota:
Un ejemplo de aprendizaje supervisado es Google Fotos donde te pregunta por los datos de algunas fotos y a partir de esta información clasifica todas las demás.

Aprendizaje Supervisado
CLASIFICACIÓN

Aprendizaje No Supervisado
CLUSTERING

Diferencias entre clasificación y agrupamiento

  • La clasificación se utiliza para el aprendizaje supervisado, mientras que el agrupamiento se utiliza para el aprendizaje no supervisado.

  • El proceso de clasificar las instancias de entrada en función de sus etiquetas de clase correspondientes se conoce como clasificación, mientras que agrupar las instancias en función de su similitud sin la ayuda de etiquetas de clase se conoce como agrupación.

  • Como la clasificación tiene etiquetas, es necesario entrenar y probar el conjunto de datos para verificar el modelo creado, pero no es necesario entrenar y probar el conjunto de datos en la agrupación.

  • La clasificación es más compleja en comparación con la agrupación, ya que hay muchos niveles en la fase de clasificación, mientras que en la agrupación solo se realiza la agrupación.

  • Los ejemplos de clasificación son regresión logística, clasificador Naive Bayes, máquinas de vectores de soporte, etc. Mientras que los ejemplos de agrupación son el algoritmo de agrupación de k-medias, el algoritmo de agrupación de c-medias difuso, el algoritmo de agrupación de Gauss (EM), etc.

Fuente: geeks for geeks

Buen Video para aportar información de Aprendizaje Supervisado vd No Supervisado
https://www.youtube.com/watch?v=7saDlsTCG5o

Comparto mis NOTAS:
La clasificación es el proceso por el cual se predice la clase de cierto dato.
Es un tipo de prendizaje supervisado ya que para que funcione se necesitan etiquetas con los datos (Labels).
Se utiliza en muchos dominios ,incluyendo la medicina, aprobacion crediticia, entre otros.
Sigue dos pasos:
-Aprendizaje (creación del modelo)
-Clasificación.
Parte desde el supuesto que nosotros ya tenemos informacion
Diferencias:
*Aprendizaje no supervisado:
_Clusters.
_Puede partir on el data science.
*Aprendizaje supervisado:
_Clasificación.
_Primero se genera un modelo y luego se clasifica.

En un cluster por que se dice que no hay etiqueta?? … igual puedo etiquetar a posteriori no?? o sea … en el mismo ejemplo del video dice:
cluster 1: low risk factor.
cluster 2: high risk factor.

eso podrían ser etiquetas no??? y están tanto en el agrupamiento como en la clasificación.
tengo esa duda.

El clusteting, es más descomplicado a la hora de tratar con los datos, pero el de clasificación, necesita primero que se le enseñe, osea generar un modelo, para que este pueda clasificar.

La diferencia entre supervisado y no supervisado, es que el primero, ya viene agrupado y el segundo agrupa por diversos cálculos. Los dos buscan agrupar futuros datos, pero aprenden de manera distinta.

Cabe recalcar que existen los algoritmos de semi supervisión, en los que no necesitamos más de uno o dos datos, para que el algoritmo pueda clasificar los datos de una forma casi que 100% efectiva.

Para este tipo de técnicas, tenemos que generar primero el modelo y luego hacer la clasificación de un dato sin la etiqueta.

Todo el objetivo de la clasificación, es determinar a qué grupo, pertenece un dato que no conocemos.

Otra rama de los algoritmos de Machine Learning, es la de clasificación, con la que entrenamos asistidamente a nuestro algoritmo.

Introducción a la clasificación.

  • Es el proceso mediante el cual se predice la clase de cierto dato. Es un tipo de aprendizaje supervisado ya que para que funcione, se necesitan etiquetas con los datos (labels) 🎫.
  • Se genera un modelo (aprendizaje) capas de clasificar (aplicación) 📚.
  • Hay aprendizaje semi-supervisado, donde solo se tienen etiquetados algunos datos.
  • En el aprendizaje no supervisado identificamos clusters, y sencillamente partimos de los datos crudos, mientras que en el supervisado se busca clasificar, se necesita primero generar el modelo que reproduzca los labels que conocemos 🗺️.

Introducción a la clasificación


  • Aquí si se necesitan las etiquetas.
  • Es el proceso mediante el cual se predice la clase de cierto dato.
  • Es un tipo de aprendizaje supervisado ya que para que funcione, se necesitan etiquetas con los datos (labels).
  • Se utiliza en muchos dominios, incluyendo la medicina, aprobación crediticia, reconocimiento de imágenes, vehículos autónomos, entre otros.
  • Sigue dos pasos: aprendizaje (creación del modelo) y clasificación.
    En el aprendizaje supervisado siempre necesitamos primero generar un modelo y después generar la clasificación, por que si no hay modelo, no podemos ejecutar directamente los algoritmos.

Si quedo claro la diferencia entre estos dos tipos de aprendizaje.

Entendería que frente a un conjunto grande de datos se usa primero clusterización para conocer sus patrones y luego se puede utilizar clasificación con una información e hipótesis previa.
¿Puede considerarse así?

Artículo para saber cuando usar cada uno 😃 :
https://www.dotactiv.com/blog/classification-vs-clustering