WARD:
Explicado por Chat GPT: Tienes razón. Primero se calcula la SSE de cada cluster individualmente antes de calcular el incremento al fusionarlos. Aquí está el paso a paso corregido:
1. **Concepto Principal:**
- Ward linkage busca minimizar la suma de las varianzas dentro de cada cluster. Se enfoca en reducir el aumento de la suma de los errores cuadráticos (SSE) al fusionar clusters.
2. **Paso a Paso:**
1. **Inicialización:**
- Comienza con cada punto de datos como su propio cluster.
2. **Cálculo de la Suma de Cuadrados (SSE) Individual:**
- Para cada cluster, calcula la SSE sumando las diferencias cuadradas entre cada punto del cluster y la media del cluster.
3. **Cálculo del Incremento en la SSE:**
- Para cada par de clusters, calcula el aumento en la SSE que resultaría de fusionarlos.
4. **Fusión de Clusters:**
- Fusiona los dos clusters cuya combinación produce el menor incremento en la SSE.
- Este paso asegura que la fusión resulta en el menor aumento posible en la varianza dentro de los clusters.
5. **Repetición:**
- Repite los pasos 2 a 4 hasta que todos los puntos estén en un solo cluster o se alcance el número deseado de clusters.
3. **Ejemplo Simplificado:**
- Imagina tres puntos de datos: A, B, y C.
- Calcula la SSE para cada cluster individual (A, B, y C).
- Luego, calcula la SSE para cada posible par de clusters (A y B, A y C, B y C) y el incremento en SSE al fusionarlos.
- Supongamos que la fusión de A y B tiene el menor aumento en SSE.
- Fusiona A y B en un solo cluster.
- Luego, calcula la SSE para los clusters restantes (AB y C) y fusiona el par que minimiza el incremento en SSE.
- Continúa el proceso hasta que todos los puntos estén en un solo cluster.
Este método asegura que en cada paso, los clusters fusionados resulten en la menor pérdida posible de homogeneidad, manteniendo los clusters lo más compactos y homogéneos posible.