Guía práctica de algoritmos de machine learning con scikit-learn

Curso de Introducción a Machine Learning

Contenido del curso

Introducción a machine learning

Algoritmos simples de machine learning

Deep learning

Conclusiones

Tomar examen

¡Hola! Te doy la bienvenida a esta clase con un nuevo reto.

Antes que nada espero que te haya ido excelente con el notebook del reto anterior y que hayas completado todos los ejercicios. Recuerda que cualquier duda puedes dejarla en comentarios de la clase para que toda la comunidad de Platzi pueda apoyarte.

Notebook de algoritmos de machine learning

En la notebook en Google Colab de esta clase encontrarás una guía para probar algoritmos de machine learning en código. Desde la carga de datos hasta entrenar el modelo y verificar su performance.

Para estos ejemplos utilizaremos la librería de scikit-learn, una de las librerías con las que podemos comenzar a aprender el uso de algoritmos de machine learning de manera más sencilla.

En los siguientes cursos de la ruta de la Escuela de Data Science profundizarás en el uso de scikit-learn y otras librerías de machine learning. ¡Comencemos con la base! 🧠

Accede al notebook aquí.

Crea una copia de este notebook en tu Google Drive o utilízalo en el entorno de Jupyter notebook que prefieras. Recuerda instalar las librerías necesarias para ejecutar el código si ejecutas tu notebook en un entorno local.

Esta notebook no tiene ejercicios adicionales como la anterior, pero este el reto que tienes para esta clase:

Identifica en qué partes del código aplicamos los diferentes conceptos teóricos aprendidos en las clases anteriores.

¡Leo tus anotaciones en los comentarios y nos vemos en el próximo módulo!

Guía práctica de algoritmos de machine learning con scikit-learn

Andres Gutiérrez Castillo

Estudiante

no hagas eso mejor has esto

cargar el dataset en formato de dataframe:

iris = datasets.load_iris(as_frame=True)
data= iris.frame

hacer el hold-out de tu data(particionar):

from sklearn.model_selection import train_test_split
train, test = train_test_split(
 data, test_size=0.2, random_state=42)

creear un scatter plot + un linea que represente un modelo de regresion lineal, en un solo paso usando sns:

import seaborn as sns
sns.jointplot(data=data, x= "petal length (cm)", y="petal width (cm)",  
kind= 'reg'
``
- si quieren aplicar la tecnica del codo para encontrar el numero de K ideal en el algoritmo K-means:

el nombre completo de la funcion de coste es: whithin cluster sum of squares (WCSS)

WCSS = [] for c in range(2,10): m_kmeans = KMeans(n_clusters = c) # 1 cargamos el modelo especificando el n_clusters m_kmeans.fit(data[["petal length (cm)", "petal width (cm)"]]) # 2 entrenamos el modelo con la data sacalada WCSS.append(m_kmeans.inertia_) # 3 guardamos el valor del WCSS

plt.plot(range(len(WCSS)), WCSS, "rx-") plt.title('Encontrar el número correcto de clusters') plt.xlabel('Nº Clusters') plt.ylabel('WCSS') plt.show()

Daniel Pérez

Rafael Rivera

Patricio Sánchez Fernández

Jonathan Vásquez Alvarado

Julián Cárdenas

David Coello

Sebastian Gaviria

Antonio Demarco Bonino

Diego Jurado

Rigoberto Acosta González

Fernando Callasaca Acuña

Leandro Tenjo

Emmanuel Guerra Sánchez

Eliana Ossio

Julian Crispin

Violeta Sosa León

Nelson Mauricio Bravo Caballero

Platzi

david jurado

Marco Antonio Latorre González

David Gallego

Dionicio Perez

Jonathan Fernando Santana Quispillo

Axel Yaguana

Team Platzi

Cristian Omar Rubio Ceja

Guía práctica de algoritmos de machine learning con scikit-learn

Introducción a machine learning

Curso actualizado

Algoritmos de Machine Learning: Preparación y Aplicación de Datos

Introducción al Machine Learning: Historia y Conceptos Básicos

Introducción a la Ciencia de Datos: Carga y Visualización de Conjuntos

Algoritmos Supervisados y No Supervisados en Machine Learning

Procesamiento y Análisis de Datos para Machine Learning

Algoritmos simples de machine learning

Modelos de Machine Learning: Uso, Implementación y Evaluación

Regresión Lineal: Predicción y Evaluación de Modelos Numéricos

Regresión Logística: Clasificación y Predicción de Probabilidades

Clasificadores de Bosque Aleatorio: Conceptos y Aplicaciones

Aprendizaje No Supervisado: Clustering con K-means