Creando nuestro modelo matematico

Clase 9 de 35 • Curso Profesional de Data Science 2016

Resumen

Vamos a construir un modelo matemático para responder nuestra pregunta original.

Lo primero que es importante explicar es una distribución beta, una distribución beta es una distribución de probabilidad canónica usada para mostrar incertidumbre alrededor de cada posible probabilidad, una probabilidad por supuesto siendo un numero entre 0 y 1, siendo la verdadera probabilidad del proceso.

Entonces entremos a esto un poco más, de nuevo la pregunta es:

¿Cuál es la probabilidad de que un tweet dado en Colombia contenga la palabra “yo”?

Entonces la respuesta va a ser un número entre 0 y 1 por definición de lo que es una probabilidad
y esta distribución de probabilidad es una distribución beta es efectivamente una tabla de consulta
para los datos dados que hemos observado y por supuesto limpiada y persistida, etc.

Una distribución beta es una función que toma dos parámetros, el primero es alpha y el segundo beta, entonces para interpretar una distribución beta vemos la altura de la curva y la altura de la curva es proporcional a la probabilidad de dibujar el valor por debajo de él en el eje x.

Creando nuestro modelo matematico

Bienvenido al curso

¿Cómo activar los subtítulos para este curso?

Bienvenido al curso profesional de Data Science

Llevar tus cosas a Producción

Llevar tus cosas a producción

Bases de datos: SQL o NoSQL

ETL

Mostrar tus datos mediante dashboards

Repaso por Jupyter Notebook

Ejemplo de inferencia en twitter para producción

Creando nuestro modelo matematico

Automatización

Llevar tus cosas a producción

Machine Learning

Un poco de contexto sobre machine learning

Entrenando un modelo de Machine Learning

Modelos de regresión, clasificación, clustering y reducción de dimensionalidad

Modelos canónicos y para que los usamos

Más modelos canonicos

Itera rápido o muere lento

Recolectando y limpiando nuestros datos

Implementando nuestros modelos de Machine Learning

Creando y ejecutando nuestro pipeline

Machine Learning

Estadística

Estadística y su aplicación en Data Science

Distribuciones de probabilidad

Inferencia estadística

Ejemplo de un modelo estadístico en un Testing A/B

Estadística

Herramientas clave que usa un data scientist

Herramientas que todos necesitamos

Servicios en la nube de Amazon: AWS / EC2

Obteniendo y explorando datos desde nuestra línea de comandos

Git

Construyendo un equipo de data science

Construyendo un equipo de Data Science

Ingenieros de datos, creadores de producto y data scientists

¿Qué sigue?

¿Qué sigue?

Cierre del curso

Contenido complementario