Fundamentos prácticos

1

Aplica Platzidoro en este curso y asegura el éxito de tu aprendizaje

2

Los fundamentos de machine learning que aprenderás

3

Introducción a Numpy

4

Introducción y manipulación de datos con Pandas

5

Introducción a ScikitLearn

6

Comandos básicos de las librerías usadas en el curso (Numpy, Pandas y ScikitLearn)

Regresión Lineal y Logística

7

¿Qué es la predicción de datos?

8

Sobreajuste y subajuste en los datos

9

Regresión lineal simple y regresión lineal múltiple

10

Regresión lineal simple con Scikit-Learn: división de los datos

11

Regresión lineal simple con Scikit-Learn: creación del modelo

12

Regresión logística con Scikit-Learn: definición y división de datos

13

Regresión logística con Scikit-Learn: evaluación del modelo

14

Matriz de confusión

15

PlatziDoro Cápsula 1

Árboles de decisión

16

¿Qué es un árbol de decisión y cómo se divide?

17

Comprendiendo nuestro data set para la creación de un árbol de decisión

18

Creando un clasificador con Scikit-Learn

19

Entrenamiento del modelo de clasificación

20

Visualización del árbol de decisión

K-Means

21

¿Qué es K-Means?

22

Cargando el data set de Iris

23

Construcción y evaluación del modelo con K-Means

24

Graficación del modelo

25

PlatziDoro Cápsula 2

Aprendizaje profundo

26

Introducción al aprendizaje profundo

27

Conceptos básicos de Tensor Flow

28

Red neuronal convolucional

29

Conociendo el set de datos para la creación de la red neuronal

30

Crea y entrena tu primera red neuronal convolucional con Tensor Flow

31

Evaluación de la red convolucional

32

PlatziDoro Cápsula 3

Despedida

33

Recomendaciones para analizar correctamente tu problema

34

Siguientes pasos para continuar aprendendiendo de Machine Learning

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

¿Qué es K-Means?

21/34
Recursos

Aportes 14

Preguntas 0

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

  • Algoritmo no supervisado.
  • Crea K grupos a partir de observaciones de un set de datos.
  • Trata información que no tiene etiquetas asignadas.
  • Agrupa información basada en sus características.
  • K = centroides
  • Aproximación a K: método del codo
    Aplicaciones:
    Segmentación por comportamiento:
  • por historial de compras
  • actividad en una aplicación móvil, web
  • Definir personas basadas en sus intereses.
  • Crear perfiles basado en el monitoreo de actividad.
    Ordenando medidas de sensores:
  • Detecta tipos de actividades en sensores de movimiento.
  • Grupos de imágenes.
  • Separar audio.
  • Identificar grupos en monitoreo de salud.

Para ahondar más en el tema es clave ese concepto de “similtud” y sus medidas. Tambien vale la pena mencionar que otro método muy usado que busca crear estos clusters , conglomerados o agrupaciones es KNN(K nearest neighbors)

K means
Es un algoritmo no supervisado que consiste en agrupar los datos a partir de las similitudes que tenga.
Estos datos se agrupan alrededor de centroides (k centroides).
Para calcular el k adecuado recurrimos al viejo método de prueba y error.

Nota:
Existe un método gráfico conocido como el método del codo (elbow), en el que elegimos el punto de inflexión de la grafica de errores obtenidos en cada valor de k

Nota.
Los centroides (también llamados K) son los puntos donde se concentran los datos y que podemos, por tanto, agruparlos en la misma categoría.

¿Qué es K-Means?
Crea K grupos a partir de un grupo de observaciones, lo elementos deben de tener similitudes.

  1. Selecciona un valor para K (Centroides)
  2. Asignamos cada uno de los elementos restante al centro mas cercano.
  3. Asignamos cada punto punto a su centroide mas cercano
  4. Repetimos paso 2 y 3 hasta que los centros no se modifiquen.

Método del codo

Lo que hace es dividir los siguiente centroides o información hasta graficarlo en un panel o un eje XY

  • Calcula el agrupamiento para diferentes de K

  • El error al cuadrado para cada punto es el cuadrado de las distancia del punto desde su centro.

K-MEANS

Es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano. Es un método utilizado en minería de datos.


Método del codo (Elbow Method)
El punto en el que se observa ese cambio brusco en la inercia nos dirá el número óptimo de Clusters a seleccionar para ese data set; o dicho de otra manera: el punto que representaría al codo del brazo será el número óptimo de Clusters para ese data set.

Método de codo

K-Means es uno de los algoritmos de clustering más populares, nos permite agrupar elementos dentro de un dataset de una manera muy fácil, sin embargo, una de sus grandes desventajas es que tiene una complejidad algorítmica grande.

para reemplazar el método manual se podría hacer un ciclo for con diferentes valores de k e ir corriendo el modelo y registrar el resultado n veces, seleccionando el modelo con el mejor resultado

Muchas gracias por esa explicación tan clara, en los resultados se puede aplicar otro modelo ?