Entrenando un modelo de Machine Learning

Clase 13 de 35 • Curso Profesional de Data Science 2016

Resumen

Machine learning es el proceso de enseñarles a las computadoras a entender patrones en los datos, destinado a imitar ese proceso de cómo los humanos: "nosotros intuimos patrones en los datos y luego entendemos esos patrones, y hacemos predicciones."

El ejemplo al que más cariño le tengo de hecho es el de un radiólogo.

Quién busca en los rayos X y dice, bien estos rayos X muestran un tumor, y el otro de hecho no tiene un tumor.

Y entonces como humanos ¿Cómo hacemos esto?, ¿Cómo un radiólogo interpreta esto?

Y la forma en la que lo hacemos es viendo rayos X, consultando con expertos, y diciendo: "OK, aquí hay unos rayos X," y el experto dice: "este tiene un tumor.", aquí hay otros y el experto dice: "estos no tienen un tumor." Y conforme pasa el tiempo como radiólogos aprenden, cada día, viendo nuevos datos, nuevos ejemplos.

Y comenzamos a entender los patrones más y más, mejor y mejor,

Lo primero que entender sobre modelos de machine learning es que ellos realmente están haciendo lo mismo. Ellos están tomando esa imagen insertada con una etiqueta, y están entendiendo, intuyendo, descubriendo patrones en esa imagen, que relacionan las diferentes cosas que están presentes o no en esa imagen, con la pregunta: ¿Tenemos un tumor presente o no?

Y las diferencias fundamentales entre un humano y un modelo de machine learning, son esas dos cosas que he mencionado antes, la cantidad de datos que ese modelo puede recibir, y la velocidad a la que el modelo puede consumir esos datos.

¿Cómo tomamos una foto y la cuantificamos o codificamos en números?, Una sobre las maneras canónicas de hacer esto, es que una foto no es nada más que un conjunto de pixeles, y cada pixel tiene un valor numérico que describe el color de ese pixel.

Otro tipo de modelo de machine learning son los que se llaman modelos no supervisados.

Por ejemplo como niño, ya sabes, aprendes si te pegas con algo y duele, lo que no pasó aquí es alguien diciendo

"Si te pegas con esto, si haces esta acción, va a doler."

Entonces en modelos no supervisados, la diferencia fundamental en términos matemáticos es el vector de etiquetas atadas a nuestros ejemplos. Pero aún podemos pasar ejemplos a un modelo de machine learning, y hacer que hasta cierto punto entienda la estructura en ese modelo.

Tenemos muchos algoritmos de Machine Learning y separando un poco:

Regresión y clasificación serán modelos supervisados.
Agrupamiento y reducción de dimensionalidad serán modelos no supervisados.

Comentarios

William Arevalo

student•

Diferentes tipos de modelos segun lo que necesites gracias a Scikit learn(Libreria de Machine Learning)

William Arevalo

student•

En este punto para entender la formula que dice Will en mas detalle
Y = Wx + B
Les recomiendo dirigirsen a el curso de introduccion al Machine Learning, les aclarara un poco mas las ideas

Pedro Escobar

student•

Para la formula que dijo

Pedro Escobar

student•

Aprendizaje Supervisado: Sucede cuando guías al algoritmo a la respuesta correcta.

Aprendizaje sin Supervisión: El algoritmo detecta patrones y los agrupa de acuerdo a esos patrones.

Alfonso Bastias

student•

Les comparto un articulo que escribí hace tiempo para una conferencia. “Predictive model based on neural networks to assist the diagnosis of malignancy of thyroid nodules”. Proceedings of the 41st International Conference on Computers & Industrial Engineering; 2011. p. 92–7.

Trata un tema muy similar al expuesto por el profesor en esta clase.
(el articulo lo pueden bajar desde la web solo colocando la referencia antes indicada en un buscador)

Entrenando un modelo de Machine Learning

Bienvenido al curso

¿Cómo activar los subtítulos para este curso?

Bienvenido al curso profesional de Data Science

Llevar tus cosas a Producción

Llevar tus cosas a producción

Bases de datos: SQL o NoSQL

ETL

Mostrar tus datos mediante dashboards

Repaso por Jupyter Notebook

Ejemplo de inferencia en twitter para producción

Creando nuestro modelo matematico

Automatización

Llevar tus cosas a producción

Machine Learning

Un poco de contexto sobre machine learning

Entrenando un modelo de Machine Learning

Modelos de regresión, clasificación, clustering y reducción de dimensionalidad

Modelos canónicos y para que los usamos

Más modelos canonicos

Itera rápido o muere lento

Recolectando y limpiando nuestros datos

Implementando nuestros modelos de Machine Learning

Creando y ejecutando nuestro pipeline

Machine Learning

Estadística

Estadística y su aplicación en Data Science

Distribuciones de probabilidad

Inferencia estadística

Ejemplo de un modelo estadístico en un Testing A/B

Estadística

Herramientas clave que usa un data scientist

Herramientas que todos necesitamos

Servicios en la nube de Amazon: AWS / EC2

Obteniendo y explorando datos desde nuestra línea de comandos

Git

Construyendo un equipo de data science

Construyendo un equipo de Data Science

Ingenieros de datos, creadores de producto y data scientists

¿Qué sigue?

¿Qué sigue?

Cierre del curso

Contenido complementario