Algoritmos de Agrupamiento: Clasificación y Aplicaciones Prácticas

Clase 17 de 24Curso de Introducción al Pensamiento Probabilístico

Contenido del curso

Resumen

Comprender cómo se agrupan los datos sin necesidad de etiquetas previas es una de las habilidades más valiosas en el mundo del machine learning. Los algoritmos de clustering permiten descubrir la estructura oculta de la información y revelar patrones que, de otro modo, pasarían desapercibidos. Desde redes sociales hasta medicina, estas técnicas transforman datos crudos en conocimiento accionable.

¿Cómo se clasifican los algoritmos de machine learning?

Existen múltiples formas de organizar los algoritmos de machine learning: supervisados, no supervisados, semisupervisados, en batch o en online [0:06]. Sin embargo, una de las clasificaciones más utilizadas los divide en dos grandes familias:

  • Algoritmos de agrupamiento o clustering: identifican la estructura interna de los datos sin usar etiquetas.
  • Algoritmos de clasificación o classification: asignan categorías predefinidas a cada dato.

Los algoritmos de clustering son especialmente poderosos porque permiten agrupar data points en diferentes conjuntos llamados clusters, revelando qué tan similares o disimilares son entre sí [0:22]. Esto resulta fundamental cuando no tenemos idea de qué grupos existen dentro de nuestra información.

¿En qué campos se aplican los algoritmos de clustering?

Las aplicaciones prácticas de estos algoritmos abarcan industrias muy diversas, y su impacto crece cada día.

¿Cómo funcionan en el análisis de redes sociales?

En redes sociales, los algoritmos de clustering permiten dividir usuarios en grupos según sus likes, los temas que consumen o las conexiones de amistad que mantienen [0:42]. Esta segmentación genera información valiosa para entender comportamientos y preferencias. Un ejemplo concreto: dentro de una plataforma educativa como Platzi, se pueden identificar los mejores estudiantes agrupando a quienes toman más clases, obtienen mejores resultados en exámenes y correlacionar eso con el tiempo invertido en la plataforma [1:06].

¿Qué papel juegan en los motores de búsqueda?

Cuando introduces un texto en un motor de búsqueda, un algoritmo identifica qué tan similar es tu consulta respecto a búsquedas anteriores [1:22]. Gracias a esta medición de similitud, el sistema puede ofrecer recomendaciones de textos relacionados con lo que estás buscando en ese momento.

¿Cómo se usan en medicina y finanzas?

En el campo de la medicina, el clustering se utiliza para detectar riesgos. Por ejemplo, considerando variables como el nivel de azúcar en sangre y el estilo de vida de una persona, es posible agruparla en categorías que indiquen su riesgo de contraer diabetes y en cuánto tiempo podría desarrollarla [1:37].

En finanzas, el análisis crediticio se beneficia enormemente de estos algoritmos. Cuando solicitas un crédito, toda la información que proporcionas se procesa para clasificar tu nivel de riesgo [1:55]. Estos algoritmos determinan si vas a pagar y en cuánto tiempo, y lo hacen cada vez mejor que los analistas humanos, lo que ha simplificado significativamente la otorgación de créditos.

¿Cómo se visualizan los clusters en la práctica?

Una forma efectiva de comprender los algoritmos de agrupamiento es mediante diagramas. Imaginemos información de ciertos genes asociados a enfermedades genéticas: al graficar estos datos, es posible identificar visualmente grupos diferenciados [2:22]. Aunque en la vida real los datos rara vez se presentan de forma tan ordenada y pristina, esta representación ilustra el concepto central.

El verdadero poder radica en la capacidad de incorporar datos sin estructura conocida y permitir que la máquina revele cómo se relacionan los diferentes grupos entre sí [2:42]. En las siguientes sesiones se abordan dos algoritmos específicos de clustering, pero existen muchos más tipos esperando ser explorados.

¿Conoces algún algoritmo de agrupamiento que no se haya mencionado? Comparte en los comentarios en qué consiste y cómo se aplica.