Tomando del ejemplo de la clase, pudiera haberse dado el caso hipotetico en que tuviera mejor silhouette score, tres cluster por sobre cu...

Pregunta de la clase:
Encontrando K
Alfonso Andres Zapata Guzman

Alfonso Andres Zapata Guzman

Pregunta
student
hace 3 años

Tomando del ejemplo de la clase, pudiera haberse dado el caso hipotetico en que tuviera mejor silhouette score, tres cluster por sobre cuatro cluster? esto para saber si siempre es necesario la doble validacion o por ejemplo si es para casos puntuales en que este muy reñido la grafica del codo?

3 respuestas
para escribir tu comentario
    Alfonso Andres Zapata Guzman

    Alfonso Andres Zapata Guzman

    student
    hace 2 años

    3Por cierto, ya conectamos en LinkedIn?2

    Conectemos en LinkedIn 👈 o tambien en GitHub 👈

    Ampliemos juntos nuestra red de contactos, sigueme y te sigo!

    Alfonso Andres Zapata Guzman

    Alfonso Andres Zapata Guzman

    student
    hace 3 años

    Si, es que daba la impresion a leguas, en definittiva el siluette score es referencial en muchos casos.

    Ve como que los siluete score con diferentes metodos no refleja que el mejor score sea la mejor opcion.

    Captura de pantalla 2023-01-29 151451.png

    Juan Esteban

    Juan Esteban

    student
    hace 3 años

    Claro, eso fue lo que me pasó cuando repliqué el ejercicio de la clase anterior, como lo comenté aquí

Curso de Clustering con Python y scikit-learn

Curso de Clustering con Python y scikit-learn

Agrupa países según métricas económicas y sociales usando clustering con Python y scikit-learn. Aprende a manejar datasets, eliminar duplicados, detectar outliers y normalizar variables. Aplica K-means, clustering jerárquico y DBSCAN.

Curso de Clustering con Python y scikit-learn
Curso de Clustering con Python y scikit-learn

Curso de Clustering con Python y scikit-learn

Agrupa países según métricas económicas y sociales usando clustering con Python y scikit-learn. Aprende a manejar datasets, eliminar duplicados, detectar outliers y normalizar variables. Aplica K-means, clustering jerárquico y DBSCAN.