Creación de Modelos Predictivos con AutoML en Google Cloud
Clase 15 de 19 • Curso de Big Data y Machine Learning con Google Cloud Platform
Resumen
¿Cómo se utiliza AutoML para crear modelos predictivos?
AutoML es un servicio que permite la creación guiada de modelos predictivos. En este caso, se utilizará para predecir la probabilidad de que un cliente de un banco tome un depósito a plazo. Comencemos revisando los datos en un archivo CSV y luego cargándolos en la plataforma Google Cloud.
¿Cómo cargar datos en Google Cloud para AutoML?
-
Acceso a datos: Inicia descargando el archivo CSV de la campaña bancaria provisto en el material del curso.
-
Subida a Google Cloud:
- Navega a BigQuery en la consola de Google Cloud.
- Crea un nuevo dataset llamado
datos
sin fecha de expiración. - Dentro del dataset, crea una nueva tabla importando el archivo CSV.
- Selecciona el delimitador
punto y coma
y añade una línea de salto para incluir los nombres de las columnas.
-
Verificación de datos: Una vez cargada la tabla, revisa los campos, el tamaño total y el número de filas. Utiliza la vista previa en BigQuery para confirmar la correcta carga del CSV.
¿Cómo entrenar un modelo con AutoML Tables?
-
Configuración inicial:
- Ve a la sección Vertex.i en Google Cloud y selecciona
data sets
. - Crea un nuevo dataset desde la opción BigQuery.
- Define el nombre:
modelo campaña banco
, tipo de datos: tabular, y método: clasificación (o regresión si aplica).
- Ve a la sección Vertex.i en Google Cloud y selecciona
-
Creación de estadísticas:
- Una vez creado, AutoML generará estadísticas sobre los datos cargados. Este proceso puede tardar unos minutos.
-
Entrenamiento del modelo:
- Selecciona la opción de entrenamiento y define la
variable objetivo
, en este casodeposit
. - Define un presupuesto para el entrenamiento y selecciona el nodo adecuado.
- Selecciona la opción de entrenamiento y define la
-
Resultados de evaluación:
- Una vez entrenado, revisa la evaluación del modelo mediante gráficos de rendimiento, la curva ROC, y la matriz de confusión.
¿Cómo se despliega un modelo entrenado?
- Despliegue en producción:
- AutoML permite el despliegue del modelo para realizar predicciones en nuevos conjuntos de datos.
- Selecciona
deploy to endpoint
y asigna un nombre al modelo.
- Pruebas de predicción:
- Realiza pruebas modificando los valores de entrada y evalúa las predicciones y el confidence score proporcionado por el modelo.
El proceso culminado de prueba del modelo permite realizar ajustes de predicción con base en cambios en las variables de entrada. Se recomienda realizar anotaciones sobre la mejora o empeoramiento de las predicciones para reflexionar sobre el aprendizaje automático en la nube. ¡Sigue explorando y experimentando con estos procedimientos ya que la práctica constante refuerza el aprendizaje!