Implementando nuestros modelos de Machine Learning
Clase 19 de 35 • Curso Profesional de Data Science 2016
Contenido del curso
Llevar tus cosas a Producción
- 3

Llevar tus cosas a producción
05:53 min - 4

Bases de datos: SQL o NoSQL
05:22 min - 5

ETL
12:01 min - 6

Mostrar tus datos mediante dashboards
07:38 min - 7

Repaso por Jupyter Notebook
07:34 min - 8

Ejemplo de inferencia en twitter para producción
20:35 min - 9

Creando nuestro modelo matematico
17:45 min - 10

Automatización
24:35 min - 11
Llevar tus cosas a producción
07:13 min
Machine Learning
- 12

Un poco de contexto sobre machine learning
10:40 min - 13

Entrenando un modelo de Machine Learning
12:03 min - 14

Modelos de regresión, clasificación, clustering y reducción de dimensionalidad
15:38 min - 15

Modelos canónicos y para que los usamos
17:02 min - 16

Más modelos canonicos
28:24 min - 17

Itera rápido o muere lento
06:33 min - 18

Recolectando y limpiando nuestros datos
23:28 min - 19

Implementando nuestros modelos de Machine Learning
Viendo ahora - 20

Creando y ejecutando nuestro pipeline
32:34 min - 21
Machine Learning
12:04 min
Estadística
Herramientas clave que usa un data scientist
Construyendo un equipo de data science
¿Qué sigue?
Ahora que dividimos nuestros datos de entrenamiento y nuestros datos de validación
para hacer validación cruzada, de nuevo, la idea es imitar el escenario de predicción, para hacernos una idea realista de cómo se desempeñará nuestro modelo al momento de predecir, sin predecir realmente en datos de prueba.
Así que aquí vamos a ajustar un modelo con datos de entrenamiento.
Previamente había dicho que al crear modelos de machine learning probablemente no hagas uno propio, o no, al menos en una situación de producción probablemente no hagas uno propio. La razón es es porque bibliotecas como scikit-learn hacen estos modelos realmente fáciles de usar
y han sido “probados en batalla” por muchas organizaciones a lo largo de muchos años.
De modo que instanciar un modelo de machine learning y ajustar ese modelo en scikit-learn
es realmente tan fácil como lo siguiente:
Son simplemente dos líneas y uno podría haber pensado que sería un montón de trabajo, ajustar estos modelos pero en realidad no lo es.
Un modelo es este objeto LogisticRegression. Tiene muchos parámetros diferentes, todos ellos con valores por defecto.
Así que al ajustar modelos en scikit-learn usar los valores por defecto nunca es una mala idea.
Por supuesto probablemente queremos desviarnos de esos valores en algún punto del proceso.
Pero empezar con lo que scikit-learn pre formula es por lo general una jugada inteligente.