22

Reto de Modelado y Evaluación de Datos con IBM Watson

6807Puntos

hace 4 años

Hola,

Ya ha pasado una semana desde que lanzamos nuestro primer reto con IBM Watson y espero que hayas podido terminar los retos relacionados a Ingesta y Preparación de Datos.

Cada meetup va a ir acompañado de retos y ejercicios que puedes realizar después del evento para reforzar tu conocimiento. Si quieres ver toda la agenda que hemos preparado en conjunto, puedes visitar nuestro Eventbrite.

Para este reto nos enfocaremos en hacer dos modelos de Machine Learning para reconocer los clientes que tienen mayor chance de aceptar tanto créditos hipotecarios como tarjetas de crédito. Para el primer modelo usaremos un notebook de Python y mediante código diseñaremos nuestro modelo de clasificación de clientes. Finalmente haremos otro modelo más para tarjeta de crédito en Auto AI, sin escribir una sola línea de código.

Pues empecemos! Y no nos olvidemos de acompañar cada paso usando el video de la sesión pasada.

Reto 1: Modelo para crédito hipotecario 😄

  1. Activemos el servicio de Watson Machine Learning, no se olviden de guardar las credenciales en un bloc de notas como se explicó en el video
  2. Creemos nuestro proyecto en Watson Studio, carguemos el “dataset” tal y como se explica en el video y seguido creemos nuestro notebook de Python.
  3. Carguemos la data en el notebook!
  4. Exploremos! Hagamos un gráfico de barras que nos pueda decir si hay desproporción entre la cantidad de clientes que aceptan vs. la cantidad que no lo aceptan el crédito.
  5. Codifiquemos! Identifiquemos todas las variables cualitativas y traduzcamos las etiquetas en números (Ejemplo: Hombres y Mujeres en 1 y 0)
  6. Seamos Creativos! Creemos dos variables nuevas en el “dataset”, esfuerzo de contacto y el plazo estimado en el que un cliente obtiene un producto nuevo.
  7. Partamos la data en train-test para poder validar nuestro modelo al final del proceso.
  8. Empecemos el modelamiento y selección de variables.
  9. Evaluaemos el modelo usando la métrica F1 Score
  10. Guardemos el modelo en Watson ML siguiendo los siguientes pasos!

Reto de modelamiento y evaluación con AutoAI 😄

Para este segundo reto, podrás aplicar el ciclo de ciencia de datos usando el mismo “dataset” pero de manera automatizada con IBM AutoAI.
Recuerda que puedes seguir el video mientras realizas los pasos siguientes:

  1. Crea un proyecto en Watson Studio o usa alguno existente.
  2. Procede a subir el “dataset”, recuerda fijarte en que las columnas se carguen correctamente.
  3. Añade al proyecto el componente Experimento de Auto AI
  4. El experimento te solicitara seleccionar un “dataset”. Selecciona el archivo que subiste previamente e indica la variable a predecir.
  5. IBM Auto AI genera una configuración automática para el tipo de variable a predecir. Si lo deseas, puedes ajustar la configuración generada, como el ratio que usara para entrenamiento y evaluación, así como los modelos a competir y la cantidad a mostrar.
  6. Seguidamente guarda la configuración y procede a correr el experimento.
  7. Una vez finalizado el experimento, procede a analizar los resultados:
  • Visualiza el camino que siguió cada pipeline
  • Compara los pipeline en base a la métrica de desempeño que prefieras y te convenga(F1, Accuracy, ROC, etc).
  1. Selecciona el pipeline que mas te convenga y procede a visualizar los ajustes que se realizó(Feature transformatios, Feature importance).
  2. Finalmente puedes guardar el modelo con la opción Save Model, recuerda que puedes guardarlo como notebook o en Watson Machine Learning(WML). Guardarlo en WML permite reutilizar el modelo generado tanto como API Rest o en Batch.

En la siguiente sesión de Platzi se analizara a fondo esta ultima parte. ¡No te lo pierdas!

Erika
Erika
erikaluna

6807Puntos

hace 4 años

Todas sus entradas
Escribe tu comentario
+ 2
1
37812Puntos

🚀💚