Itera rápido o muere lento

Clase 17 de 35 • Curso Profesional de Data Science 2016

Resumen

Somos data scientists y también somos ingenieros de software. Tenemos que implementar estos modelos en código. Así que hay un elemento muy práctico para hacer esto:

"Itera Rápidamente o Muere Lentamente"

Invertir tiempo en suavizar tu flujo de trabajo por adelantado es realmente importante. Es la diferencia entre ajustar modelos geniales y tener resultados estupendos, y quizás solamente, ya sabes, juguetear con tres o cuatro

Generalmente no es recomendable crear tus propios modelos de machine learning desde cero.

En lenguajes que son populares para data science, por ejemplo Python, por ejemplo R, existen paquetes de software que tienen estos modelos pre-construidos para ti.

Por supuesto en machine learning como en ingeniería de software construimos capas de abstracción encima de las cosas. Así que, por ejemplo, otro profesor de Platzi el otro día estaba dando un gran ejemplo sobre manejar un auto y cómo se relaciona con la ingeniería de software.Como desarrollador de software, como data scientist, podrías programar, ya sabes, alguien que presione el pedal de ese carro.Y, dado que el pedal es presionado, ese auto empezará a moverse.

Sin embargo, para crear un programa que usa ese pedal, que interactúa con ese pedal y crear un programa que funcione no necesariamente tienes que saber lo que está pasando bajo el capó de ese auto. Y esto es lo que se llama una "capa de abstracción "

Sin embargo, cuanto mejor entendamos ese carro, mejor entendamos lo que está pasando bajo el capó de nuestros modelos de machine learning, mejor podremos usarlos, y serán, digamos, más intuitivos los cambios que podamos hacerles y más íntimamente entenderemos por qué están actuando de la manera en que actúan.

No podemos impedir que alguien implemente sus propios algoritmos. Pero al construir sistemas de producción, en la mayoría de los casos un algoritmo pre-construido en una biblioteca como scikit-learn, en bibliotecas en R, es probablemente suficiente para tus necesidades.

Itera rápido o muere lento

Bienvenido al curso

¿Cómo activar los subtítulos para este curso?

Bienvenido al curso profesional de Data Science

Llevar tus cosas a Producción

Llevar tus cosas a producción

Bases de datos: SQL o NoSQL

ETL

Mostrar tus datos mediante dashboards

Repaso por Jupyter Notebook

Ejemplo de inferencia en twitter para producción

Creando nuestro modelo matematico

Automatización

Llevar tus cosas a producción

Machine Learning

Un poco de contexto sobre machine learning

Entrenando un modelo de Machine Learning

Modelos de regresión, clasificación, clustering y reducción de dimensionalidad

Modelos canónicos y para que los usamos

Más modelos canonicos

Itera rápido o muere lento

Recolectando y limpiando nuestros datos

Implementando nuestros modelos de Machine Learning

Creando y ejecutando nuestro pipeline

Machine Learning

Estadística

Estadística y su aplicación en Data Science

Distribuciones de probabilidad

Inferencia estadística

Ejemplo de un modelo estadístico en un Testing A/B

Estadística

Herramientas clave que usa un data scientist

Herramientas que todos necesitamos

Servicios en la nube de Amazon: AWS / EC2

Obteniendo y explorando datos desde nuestra línea de comandos

Git

Construyendo un equipo de data science

Construyendo un equipo de Data Science

Ingenieros de datos, creadores de producto y data scientists

¿Qué sigue?

¿Qué sigue?

Cierre del curso

Contenido complementario