Fundamentos prácticos

1

Aplica Platzidoro en este curso y asegura el éxito de tu aprendizaje

2

Los fundamentos de machine learning que aprenderás

3

Introducción a Numpy

4

Introducción y manipulación de datos con Pandas

5

Introducción a ScikitLearn

6

Comandos básicos de las librerías usadas en el curso (Numpy, Pandas y ScikitLearn)

Regresión Lineal y Logística

7

¿Qué es la predicción de datos?

8

Sobreajuste y subajuste en los datos

9

Regresión lineal simple y regresión lineal múltiple

10

Regresión lineal simple con Scikit-Learn: división de los datos

11

Regresión lineal simple con Scikit-Learn: creación del modelo

12

Regresión logística con Scikit-Learn: definición y división de datos

13

Regresión logística con Scikit-Learn: evaluación del modelo

14

Matriz de confusión

15

PlatziDoro Cápsula 1

Árboles de decisión

16

¿Qué es un árbol de decisión y cómo se divide?

17

Comprendiendo nuestro data set para la creación de un árbol de decisión

18

Creando un clasificador con Scikit-Learn

19

Entrenamiento del modelo de clasificación

20

Visualización del árbol de decisión

K-Means

21

¿Qué es K-Means?

22

Cargando el data set de Iris

23

Construcción y evaluación del modelo con K-Means

24

Graficación del modelo

25

PlatziDoro Cápsula 2

Aprendizaje profundo

26

Introducción al aprendizaje profundo

27

Conceptos básicos de Tensor Flow

28

Red neuronal convolucional

29

Conociendo el set de datos para la creación de la red neuronal

30

Crea y entrena tu primera red neuronal convolucional con Tensor Flow

31

Evaluación de la red convolucional

32

PlatziDoro Cápsula 3

Despedida

33

Recomendaciones para analizar correctamente tu problema

34

Siguientes pasos para continuar aprendendiendo de Machine Learning

Comandos básicos de las librerías usadas en el curso (Numpy, Pandas y ScikitLearn)

6/34

Lectura

Numpy

Biblioteca de Python comúnmente usada en la ciencias de datos y aprendizaje automático (Machine Learning). Proporciona una estructura de datos de matriz que tiene diversos beneficios sobre las listas regulares.

Importar la biblioteca:
import numpy as np

Crear arreglo unidimensional:
my_array = np.array([1, 2, 3, 4, 5])
Resultado: array([1, 2, 3, 4, 5])

Crear arreglo bidimensional:
np.array( [[‘x’, ‘y’, ‘z’], [‘a’, ‘c’, ‘e’]])
Resultado:
[[‘x’ ‘y’ ‘z’]
[‘a’ ‘c’ ‘e’]]

Mostrar el número de elementos del arreglo:
len(my_array)

Sumar todos los elementos de un arreglo unidimensional:
np.sum(my_array)

Obtener el número máximo de los elementos del arreglo unidimensional
np.max(my_array)

Crear un arreglo de una dimensión con el número 0:
np.zeros(5)
Resultado: array([0., 0., 0., 0., 0.])

Crear un arreglo de una dimensión con el número 1:
np.ones(5)
Resultado: array([1., 1., 1., 1., 1.])

Comando de Python para conocer el tipo del dato:
type(variable)

Ordenar un arreglo:
np.order(x)

Ordenar un arreglo por su llave:
np.sort(arreglo, order = ‘llave’)

Crear un arreglo de 0 a N elementos:
np.arange(n)
Ej.
np.arange(25)
Resultado:
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,
17, 18, 19, 20, 21, 22, 23, 24])

Crear un arreglo de N a M elementos:
np.arange(n, m)
Ej.
np.arange(5, 30)
Resultado:
array([ 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,
22, 23, 24, 25, 26, 27, 28, 29])

Crear un arreglo de N a M elementos con un espacio de cada X valores:
np.arange(n, m, x)
Ej.
np.arange(5, 50, 5)
Resultado:
array([ 5, 10, 15, 20, 25, 30, 35, 40, 45])

Crear arreglo de NxM:
np.full( (n, m), x )
Ej.
np.full( (3, 5), 10)
Resultado:
array([
[10, 10, 10, 10, 10],
[10, 10, 10, 10, 10],
[10, 10, 10, 10, 10]
])

Número de elementos del arreglo:
len(my_array)

Pandas

Pandas es una herramienta de manipulación de datos de alto nivel, es construido con la biblioteca de Numpy. Su estructura de datos más importante y clave en la manipulación de la información es DataFrame, el cuál nos va a permitir almacenar y manejar datos tabulados observaciones (filas) y variables (columnas).

Importar la biblioteca:
import pandas as pd

Generar una serie con Pandas:
pd.Series([5, 10, 15, 20, 25])
Resultado:
0 5
1 10
2 15
3 20
4 25

Crear un Dataframe:
lst = [‘Hola’, ‘mundo’, ‘robótico’]
df = pd.DataFrame(lst)
Resultado:
0
0 Hola
1 mundo
2 robótico

Crear un Dataframe con llave y dato:
data = {‘Nombre’:[‘Juan’, ‘Ana’, ‘Toño’, ‘Arturo’],
‘Edad’:[25, 18, 23, 17],
‘Pais’: [‘MX’, ‘CO’, ‘BR’, ‘MX’] }
df = pd.DataFrame(data)
Resultado:

Resultado Data Frame.png

Leer archivo CSV:
pd.read_csv(“archivo.csv”)

Mostrar cabecera:
data.head(n)

Mostrar columna del archivo leído:
data.columna

Mostrar los últimos elementos:
data.tail()

Mostrar tamaño del archivo leído:
data.shape

Mostrar columnas:
data.columns

Describe una columna:
data[‘columna’].describe()

Ordenar datos del archivo leído:
data.sort_index(axis = 0, ascending = False)

Scikit Learn

Scikit Learn es una biblioteca de Python que está conformada por algoritmos de clasificación, regresión, reducción de la dimensionalidad y clustering. Es una biblioteca clave en la aplicación de algoritmos de Machine Learning, tiene los métodos básicos para llamar un algoritmo, dividir los datos en entrenamiento y prueba, entrenarlo, predecir y ponerlo a prueba.

Importar biblioteca:
from sklearn import [modulo]

División del conjunto de datos para entrenamiento y pruebas:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)

Entrenar modelo:
[modelo].fit(X_train, y_train)

Predicción del modelo:
Y_pred = [modelo].predict(X_test)

Matriz de confusión:
metrics.confusion_matrix(y_test, y_pred)

Calcular la exactitud:
metrics.accuracy_score(y_test, y_pred)

Aportes 22

Preguntas 1

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

Cheat sheet, machetes, chuletas, ayudas memorias o como quieran llamarlo… para que los tengan en pdf o impreso siempre que les haga falta…

Entran y lo descargan desde la imagen que aparece.

<h1>Comandos básicos de las librerías usadas en el curso (Numpy, Pandas y ScikitLearn)</h1>
<h1>Numpy</h1>

Numpy

Biblioteca de Python comúnmente usada en la ciencias de datos y aprendizaje automático (Machine Learning). Proporciona una estructura de datos de matriz que tiene diversos beneficios sobre las listas regulares.

Importar la biblioteca:

import numpy as np

Crear arreglo unidimensional:

my_array = np.array([1, 2, 3, 4, 5])
Resultado: array([1, 2, 3, 4, 5])

Crear arreglo bidimensional:

np.array( [[‘x’, ‘y’, ‘z’], [‘a’, ‘c’, ‘e’]])

# Resultado:
[[‘x’ ‘y’ ‘z’]
[‘a’ ‘c’ ‘e’]]

Mostrar el número de elementos del arreglo:

len(my_array)

Sumar todos los elementos de un arreglo unidimensional:

np.sum(my_array)

Obtener el número máximo de los elementos del arreglo unidimensional

np.max(my_array)

Crear un arreglo de una dimensión con el número 0:

np.zeros(5)
Resultado: array([0., 0., 0., 0., 0.])

Crear un arreglo de una dimensión con el número 1:

np.ones(5)
Resultado: array([1., 1., 1., 1., 1.])

Comando de Python para conocer el tipo del dato:

type(variable)

Ordenar un arreglo:

np.order(x)

Ordenar un arreglo por su llave:

np.sort(arreglo, order = ‘llave’)

Crear un arreglo de 0 a N elementos:

np.arange(n)

# Ej.
np.arange(25)

# Resultado:
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,
17, 18, 19, 20, 21, 22, 23, 24])

Crear un arreglo de N a M elementos:

np.arange(n, m)

# Ej.
np.arange(5, 30)

# Resultado:
array([ 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,
22, 23, 24, 25, 26, 27, 28, 29])

Crear un arreglo de N a M elementos con un espacio de cada X valores:

np.arange(n, m, x)

# Ej.
np.arange(5, 50, 5)

# Resultado:
array([ 5, 10, 15, 20, 25, 30, 35, 40, 45])

Crear arreglo de NxM:

len(my_array)

Número de elementos del arreglo:

len(my_array)
<h1>Pandas</h1>

Pandas

Pandas es una herramienta de manipulación de datos de alto nivel, es construido con la biblioteca de Numpy. Su estructura de datos más importante y clave en la manipulación de la información es DataFrame, el cuál nos va a permitir almacenar y manejar datos tabulados observaciones (filas) y variables (columnas).

Importar la biblioteca:

import pandas as pd

Generar una serie con Pandas:

pd.Series([5, 10, 15, 20, 25])

# Resultado:
0 5
1 10
2 15
3 20
4 25

Crear un Dataframe:

lst = [‘Hola’, ‘mundo’, ‘robótico’]
df = pd.DataFrame(lst)

# Resultado:
0
0 Hola
1 mundo
2 robótico

Crear un Dataframe con llave y dato:

data = {‘Nombre’:[‘Juan’, ‘Ana’, ‘Toño’, ‘Arturo’],
‘Edad’:[25, 18, 23, 17],
‘Pais’: [‘MX’, ‘CO’, ‘BR’, ‘MX’] }
df = pd.DataFrame(data)

# Resultado:
Resultado Data Frame.png

Leer archivo CSV:

pd.read_csv(“archivo.csv”)

Mostrar cabecera:

data.head(n)

Mostrar columna del archivo leído:

data.columna

Mostrar los últimos elementos:

data.tail()

Mostrar tamaño del archivo leído:

data.shape

Mostrar columnas:

data.columns

Describe una columna:

data[‘columna’].describe()

Ordenar datos del archivo leído:

data.sort_index(axis = 0, ascending = False)
<h1>Scikit Learn</h1>

Scikit Learn

Scikit Learn es una biblioteca de Python que está conformada por algoritmos de clasificación, regresión, reducción de la dimensionalidad y clustering. Es una biblioteca clave en la aplicación de algoritmos de Machine Learning, tiene los métodos básicos para llamar un algoritmo, dividir los datos en entrenamiento y prueba, entrenarlo, predecir y ponerlo a prueba.

Importar biblioteca:

from sklearn import [modulo]

División del conjunto de datos para entrenamiento y pruebas:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)

Entrenar modelo:

[modelo].fit(X_train, y_train)

Predicción del modelo:

Y_pred = [modelo].predict(X_test)

Matriz de confusión:

metrics.confusion_matrix(y_test, y_pred)

Calcular la exactitud:

metrics.accuracy_score(y_test, y_pred)

Que bonito este curso.

un Array de varias dimensiones se hace:

arrayNxM= np.array([['1','2','3'], ['4','5','6']])```

En la parte de Numpy casi al final, no muestra como Crear arreglo de NxM
Alguien nos puede ayudar con esto por favor.

Les comparto mi mazo de Anki sobre el tema para memorizar los comandos más importantes

Mazo de Anki - Librerías de Python

Anki es un programa de computadora y celular que permite crear apuntes dinámicos a través de tarjetas de estudio y repetición espaciada.

En cada mazo, cada día te va mostrando tarjetas de estudio con preguntas que el mismo usuario escribe y el usuario debe recordar ese concepto. El usuario escribe qué tan bien recordó la respuesta y con base en ello te vuelve a preguntar esa misma información 1 mes después, o 6 meses después y así sucesivamente. De esta forma te aseguras de no aprender algo ahora o para el examen muy eficazmente pero más adelante haberlo olvidado por completo.

Hola, Acá adjuntos mis apuntes en Notion que iré incrementando a lo largo de todo el curso.

Espero les sean de muchísima utilidad.
https://bit.ly/Apuntes_MLearning

La mejor

Excelente :3

Estoy comenzando a conocer estas bibliotecas y puedo ver que son herramientas Potentes!!

Muchas gracias por el resumen, el curso va muy bien!

Excelentes herramientas

lo máximo !!

NICE SUMMARY!!

que buen summary, asi con los comandos es mas facil seguir el ritmo de lo que se va haciendo

Buenaso!!

Muy interesante el resumen, todo lo necesario para seguir el curso.

Muy buena documentación, gracias por el resumen.

Gracias, Buen resumen.

excelente, gracias.