Creación de Modelos Predictivos con AutoML en Google Cloud

Clase 15 de 19Curso de Big Data y Machine Learning con Google Cloud Platform

Resumen

¿Cómo se utiliza AutoML para crear modelos predictivos?

AutoML es un servicio que permite la creación guiada de modelos predictivos. En este caso, se utilizará para predecir la probabilidad de que un cliente de un banco tome un depósito a plazo. Comencemos revisando los datos en un archivo CSV y luego cargándolos en la plataforma Google Cloud.

¿Cómo cargar datos en Google Cloud para AutoML?

  1. Acceso a datos: Inicia descargando el archivo CSV de la campaña bancaria provisto en el material del curso.

  2. Subida a Google Cloud:

    • Navega a BigQuery en la consola de Google Cloud.
    • Crea un nuevo dataset llamado datos sin fecha de expiración.
    • Dentro del dataset, crea una nueva tabla importando el archivo CSV.
    • Selecciona el delimitador punto y coma y añade una línea de salto para incluir los nombres de las columnas.
  3. Verificación de datos: Una vez cargada la tabla, revisa los campos, el tamaño total y el número de filas. Utiliza la vista previa en BigQuery para confirmar la correcta carga del CSV.

¿Cómo entrenar un modelo con AutoML Tables?

  1. Configuración inicial:

    • Ve a la sección Vertex.i en Google Cloud y selecciona data sets.
    • Crea un nuevo dataset desde la opción BigQuery.
    • Define el nombre: modelo campaña banco, tipo de datos: tabular, y método: clasificación (o regresión si aplica).
  2. Creación de estadísticas:

    • Una vez creado, AutoML generará estadísticas sobre los datos cargados. Este proceso puede tardar unos minutos.
  3. Entrenamiento del modelo:

    • Selecciona la opción de entrenamiento y define la variable objetivo, en este caso deposit.
    • Define un presupuesto para el entrenamiento y selecciona el nodo adecuado.
  4. Resultados de evaluación:

    • Una vez entrenado, revisa la evaluación del modelo mediante gráficos de rendimiento, la curva ROC, y la matriz de confusión.

¿Cómo se despliega un modelo entrenado?

  1. Despliegue en producción:
    • AutoML permite el despliegue del modelo para realizar predicciones en nuevos conjuntos de datos.
    • Selecciona deploy to endpoint y asigna un nombre al modelo.
  2. Pruebas de predicción:
    • Realiza pruebas modificando los valores de entrada y evalúa las predicciones y el confidence score proporcionado por el modelo.

El proceso culminado de prueba del modelo permite realizar ajustes de predicción con base en cambios en las variables de entrada. Se recomienda realizar anotaciones sobre la mejora o empeoramiento de las predicciones para reflexionar sobre el aprendizaje automático en la nube. ¡Sigue explorando y experimentando con estos procedimientos ya que la práctica constante refuerza el aprendizaje!