Automatización
Clase 10 de 35 • Curso Profesional de Data Science 2016
Contenido del curso
Llevar tus cosas a Producción
- 3

Llevar tus cosas a producción
05:53 min - 4

Bases de datos: SQL o NoSQL
05:22 min - 5

ETL
12:01 min - 6

Mostrar tus datos mediante dashboards
07:38 min - 7

Repaso por Jupyter Notebook
07:34 min - 8

Ejemplo de inferencia en twitter para producción
20:35 min - 9

Creando nuestro modelo matematico
17:45 min - 10

Automatización
Viendo ahora - 11
Llevar tus cosas a producción
07:13 min
Machine Learning
- 12

Un poco de contexto sobre machine learning
10:40 min - 13

Entrenando un modelo de Machine Learning
12:03 min - 14

Modelos de regresión, clasificación, clustering y reducción de dimensionalidad
15:38 min - 15

Modelos canónicos y para que los usamos
17:02 min - 16

Más modelos canonicos
28:24 min - 17

Itera rápido o muere lento
06:33 min - 18

Recolectando y limpiando nuestros datos
23:28 min - 19

Implementando nuestros modelos de Machine Learning
16:23 min - 20

Creando y ejecutando nuestro pipeline
32:34 min - 21
Machine Learning
12:04 min
Estadística
Herramientas clave que usa un data scientist
Construyendo un equipo de data science
¿Qué sigue?
Lo que no estamos haciendo es ejecutando el código de forma manual. Ahora pasaremos a automatizar el proceso, lo cual es sinónimo de llevar nuestras cosas a producción.
Crearemos un panel de control, repito, que se refresque solo. Para ello usaremos bokeh
Para usar Bokeh lo primero que tenemos que hacer es iniciar un servidor Bokeh. Para hacer eso vamos a ir a nuestra terminal.
bokeh serve
Lo segundo que vamos a hacer aquí es traer nuestros tweets y luego definir alfa y beta. Recuerden que alfa y beta se definen primero, calculando primero cuántos de estos tweets realmente contienen la palabra clave “yo”, la cual nos interesa. Y continuación alfa se define como uno más el número de ocurrencias positivas. Y beta se define como uno más el número de ocurrencias negativas.
Después generamos código para esta figura en sí. De nuevo, todo esto está en la documentación de Bokeh. Creamos este objeto figure. Le damos un título, una etiqueta para el eje x, una etiqueta para el eje y, dimensiones en nuestro cuaderno interactivo.
Y finalmente, y esto es digamos que la sustancia aquí, definimos esta función update. Llamamos esta función update cada 50 milisegundos y lo que hace cada 50 milisegundos es:
- Trae tweets
- Redefine alfa y beta.
- Recalcula
- Agrega estos nuevos datos a nuestra visualización.
Pero por supuesto la idea aquí es automatización, esa es realmente la palabra clave. Que cada vez que queramos ver, ya sabes, cómo se ve esta curva después de observar muchos más datos
sólo hay un lugar en el cual buscar. Y lo que no voy a hacer es volver a ejecutar manualmente este análisis. Sólo estoy mirando mi modelo llevado a producción, obteniendo estos resultados y realmente pasando a lo siguiente.