2

Ejemplo de clustering mediante una métrica de distancias euclideas entre puntos.

Trabajaremos nuestro ejemplo agrupando los datos de la siguiente tabla

Puntoxy
A1210
A225
A384
A427
A575
A664
A712
A849
<h1>Solucion:</h1>

La gráfica de dispersión de datos inicial es la siguiente, donde podemos identificar los puntos de referencia en torno a los cuales trabajaremos.

img1.png

Iteración 1.

Los centroides identificados son:

  • C_1 = (2,10) = A1

  • C_2 = (2,5) = A2

  • C_3 = (1,2) = A7

El análisis de distancias para el centroide A1:

Para realizar el análisis de las distancias euclidianas se utilizará la siguiente ecuación en cada uno de los casos:

CodeCogsEqn.png

De esa forma se genera la siguiente tabla de datos:

img1.jpg

Obtenemos entonces la matriz de distancias euclidianas para nuestra primera iteración:

img2.png

Identificando el menor valor de cada columna en la matriz anterior y asignándole un uno formaremos la siguiente matriz de agrupamiento.

img3.png

Con estos datos procederemos a calcular las posiciones de los nuevos centroides:

img9.png
img5.jpg

Como podemos observar los últimos clusteres obtenidos se han mantenido constantes con respecto a la iteración anterior, de igual forma podemos ver que ocurre lo mismo en la última gráfica de dispersión por lo tanto podemos concluir que se han estabilizado.

Iteración 2.

Generamos la siguiente tabla de datos:

img4.png

Obtenemos entonces la matriz de distancias euclidianas para nuestra primera iteración:

img5.png

Identificando el menor valor de cada columna en la matriz anterior y asignándole un uno formaremos la siguiente matriz de agrupamiento.

img6.png

Con estos datos procederemos a calcular las posiciones de los nuevos centroides:

img7.png
img8.png

Como tenemos un nuevo cluster tendremos que volver a analizar en una siguiente iteración.

<h1>Iteración 3.</h1>

Generamos la siguiente tabla de datos:

img10.png

Obtenemos entonces la matriz de distancias euclidianas para nuestra tercera iteración:

img11.png

Identificando el menor valor de cada columna en la matriz anterior y asignándole un uno formaremos la siguiente matriz de agrupamiento.

img12.png

Con estos datos procederemos a calcular las posiciones de los nuevos centroides:

img13.png
img14.png

Como tenemos un nuevo cluster tendremos que volver a analizar en una siguiente iteración.

Iteración 4.

Generamos la siguiente tabla de datos:

img15.png

Obtenemos entonces la matriz de distancias euclidianas para nuestra primera iteración:

img16.png

Identificando el menor valor de cada columna en la matriz anterior y asignándole un uno formaremos la siguiente matriz de agrupamiento.

img17.png

Con estos datos procederemos a calcular las posiciones de los nuevos centroides:

img18.png
img19.png

Como podemos observar los últimos clusteres obtenidos se han mantenido constantes con respecto a la iteración anterior, de igual forma podemos ver que ocurre lo mismo en la última gráfica de dispersión por lo tanto podemos concluir que se han estabilizado.

img20.png
Escribe tu comentario
+ 2