No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Aprende todo un fin de semana sin pagar una suscripción 🔥

Aprende todo un fin de semana sin pagar una suscripción 🔥

Regístrate

Comienza en:

3D
23H
25M
49S

¿Qué es el algoritmo de K-means y cómo funciona?

5/27
Recursos

Aportes 2

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

o inicia sesión.

Un par de observaciones que pueden servir.

  1. Kmeans es un método basado en “distancias”, luego el calculo en cada iteracion se puede ver afectado ante la existencia de outliers.
  2. Es costoso a nivel computacional cuando la cantidad de datos aumenta, ya que implica comparar cada dato con todos los demás.
  3. Tiene un problema grave y es que a cada punto NECESARIAMENTE lo ubica dentro de un cluster. Si tenemos un outlier nunca lo vamos a percibir por que lo va a asignar a un cluster

Hice mi propia implementación del algoritmo KMeans con numpy y scipy, chéquenlo por si les interesa tener una idea de cómo funciona a nivel de código:

kmeans

Debería funcionar con cualquier número de features y de clusters.

Aquí un notebook con su uso:
notebook

Detalles:

  • Aparentemente no funciona muy bien con un número de clusters muy grande.
  • Algunas clasificaciones funcionan mal debido a la forma en la que los centros son elegidos.