Entrenando un modelo de Machine Learning

Clase 13 de 35Curso Profesional de Data Science 2016

Resumen

Machine learning es el proceso de enseñarles a las computadoras a entender patrones en los datos, destinado a imitar ese proceso de cómo los humanos: “nosotros intuimos patrones en los datos y luego entendemos esos patrones, y hacemos predicciones.”

El ejemplo al que más cariño le tengo de hecho es el de un radiólogo.

Quién busca en los rayos X y dice, bien estos rayos X muestran un tumor, y el otro de hecho no tiene un tumor.

Y entonces como humanos ¿Cómo hacemos esto?, ¿Cómo un radiólogo interpreta esto?

Y la forma en la que lo hacemos es viendo rayos X, consultando con expertos, y diciendo: “OK, aquí hay unos rayos X,” y el experto dice: “este tiene un tumor.”, aquí hay otros y el experto dice: “estos no tienen un tumor.” Y conforme pasa el tiempo como radiólogos aprenden, cada día, viendo nuevos datos, nuevos ejemplos.

Y comenzamos a entender los patrones más y más, mejor y mejor,

Lo primero que entender sobre modelos de machine learning es que ellos realmente están haciendo lo mismo. Ellos están tomando esa imagen insertada con una etiqueta, y están entendiendo, intuyendo, descubriendo patrones en esa imagen, que relacionan las diferentes cosas que están presentes o no en esa imagen, con la pregunta: ¿Tenemos un tumor presente o no?

Y las diferencias fundamentales entre un humano y un modelo de machine learning,
son esas dos cosas que he mencionado antes, la cantidad de datos que ese modelo puede recibir, y la velocidad a la que el modelo puede consumir esos datos.

¿Cómo tomamos una foto y la cuantificamos o codificamos en números?, Una sobre las maneras canónicas de hacer esto, es que una foto no es nada más que un conjunto de pixeles, y cada pixel tiene un valor numérico que describe el color de ese pixel.

Otro tipo de modelo de machine learning son los que se llaman modelos no supervisados.

Por ejemplo como niño, ya sabes, aprendes si te pegas con algo y duele, lo que no pasó aquí es alguien diciendo

“Si te pegas con esto, si haces esta acción, va a doler.”

Entonces en modelos no supervisados, la diferencia fundamental en términos matemáticos es el vector de etiquetas atadas a nuestros ejemplos. Pero aún podemos pasar ejemplos a un modelo de machine learning, y hacer que hasta cierto punto entienda la estructura en ese modelo.

Tenemos muchos algoritmos de Machine Learning y separando un poco:

  • Regresión y clasificación serán modelos supervisados.
  • Agrupamiento y reducción de dimensionalidad serán modelos no supervisados.