Creando y ejecutando nuestro pipeline

Clase 20 de 35Curso Profesional de Data Science 2016

Resumen

Desafortunadamente, como data scientists pasamos la mayoría de nuestro tiempo recolectando datos, limpiando datos, explorando estos datos, haciendo preguntas sobre estos datos, leyendo, pensando y hablando con otras personas.

Construir modelos de machine learning es muy importante y muy divertido, es esta tarea atractiva que todos quieren hacer, pero es desafortunadamente donde pasamos la minoría de nuestro tiempo.

Hemos llegado a la parte del proceso donde comenzamos a construir modelos y comenzamos construyendo muchos.

Así que aquí tendremos en verdad un poco de diversión.

Bien, recuerda de las diapositivas anteriores que “todo es un hiper parámetro.” Desde la forma en la cuál agregamos características los datos hasta el modelo que usamos, hasta cómo combinamos esos modelos, y hasta cómo parametrizamos esas transformaciones de características, etc.