Detallen bien su escogencia del número de clusters cuando evalúen el rendimiento del modelo con el silhouette score. Aquà por ejemplo generé los datos con cuatro centroides como en la clase, e hice el entrenamiento del modelo con tres clusters y obtuve lo siguiente:
También realicé el entrenamiento con cuatro clusters y obtuve lo siguiente:
Observen que el silhouette score fue mejor (más cercano a 1) con tres clusters, pero de entrada sabemos que en realidad en los datos hay cuatro clusters diferentes, asà que sÃ, no se confÃen solo en la primera métrica que saquen, hay que detallar más los resultados 😃
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?