Implementando nuestros modelos de Machine Learning

Clase 19 de 35 • Curso Profesional de Data Science 2016

Resumen

Ahora que dividimos nuestros datos de entrenamiento y nuestros datos de validación
para hacer validación cruzada, de nuevo, la idea es imitar el escenario de predicción, para hacernos una idea realista de cómo se desempeñará nuestro modelo al momento de predecir, sin predecir realmente en datos de prueba.

Así que aquí vamos a ajustar un modelo con datos de entrenamiento.

Previamente había dicho que al crear modelos de machine learning probablemente no hagas uno propio, o no, al menos en una situación de producción probablemente no hagas uno propio. La razón es es porque bibliotecas como scikit-learn hacen estos modelos realmente fáciles de usar
y han sido “probados en batalla” por muchas organizaciones a lo largo de muchos años.

De modo que instanciar un modelo de machine learning y ajustar ese modelo en scikit-learn
es realmente tan fácil como lo siguiente:

Son simplemente dos líneas y uno podría haber pensado que sería un montón de trabajo, ajustar estos modelos pero en realidad no lo es.

Un modelo es este objeto LogisticRegression. Tiene muchos parámetros diferentes, todos ellos con valores por defecto.

Así que al ajustar modelos en scikit-learn usar los valores por defecto nunca es una mala idea.

Por supuesto probablemente queremos desviarnos de esos valores en algún punto del proceso.
Pero empezar con lo que scikit-learn pre formula es por lo general una jugada inteligente.