Uso de AutoML Tables en Google Cloud para Modelos de Clasificación
Clase 44 de 48 • Entrenamiento de Google Cloud Platform
Resumen
¿Cómo identificar el servicio de AutoML en Google Cloud?
AutoML es una herramienta poderosa dentro de Google Cloud que te permite construir modelos de aprendizaje automático personalizados sin necesidad de un profundo conocimiento técnico. Para acceder a AutoML, primero debes dirigirte a la consola de Google Cloud. Allí, encuentra la sección de inteligencia artificial que incluye la plataforma AI en la que se presentan varios servicios vitales para el aprendizaje automático. El servicio conocido como Tables Data sets es el que utilizarás para crear y gestionar tus conjuntos de datos.
¿Cómo se genera un nuevo data set en AutoML?
Crear un nuevo data set en AutoML es un proceso sencillo y fundamental del laboratorio que debes completar. El proceso se inicia generando un data set con los parámetros por defecto, aunque puedes personalizar el nombre según tu preferencia. Es aquí donde la interoperabilidad con otros servicios analíticos de Google cobra importancia, ya que permite importar rápidamente datos desde un data warehouse o un repositorio ya existente en Google Cloud.
¿Cuál es el proceso de importación y etiquetado de datos?
Al importar los datos, AutoML ejecuta automáticamente un proceso de detección del esquema. Esta etapa es crucial ya que ayuda a identificar tanto la estructura de los datos como el etiquetado, proporcionando una vista previa automática de las columnas, tipos de datos y categorizaciones. AutoML se encarga de mostrar la distribución de los datos, lo que facilita el análisis preliminar sin necesidad de intervención manual.
¿Cómo entrenar y evaluar un modelo en AutoML?
Una vez que has configurado tu data set, el siguiente paso es entrenar un modelo. En el laboratorio, debes definir si el objetivo es clasificación binaria, tal como determinar la probabilidad de compra. Puedes ajustar el entrenamiento dividiendo los datos en conjuntos de prueba, entrenamiento y validación de forma automática o personalizada.
¿Qué implica el proceso de entrenamiento del modelo?
El entrenamiento inicia cuando seleccionas la opción train model. Cabe destacar que este es un proceso que consume tiempo ya que se realizan múltiples tareas en segundo plano: levantamiento de contenedores, provisión de datos, y la ejecución de algoritmos. Como resultado, obtienes métricas significativas como las curvas de precisión y listas de las columnas involucradas en el entrenamiento, permitiendo evaluar el desempeño de las rondas de entrenamiento realizadas.
¿Cómo se lleva a cabo la evaluación del modelo?
La evaluación del modelo es el siguiente paso crítico. Con los datos de prueba no utilizados anteriormente, AutoML ejecuta el modelo entrenado y proporciona métricas clave como precisión, curvas de aprendizaje, y gráficos de falsos positivos y negativos. Un modelo con precisión superior al 96-97% suele considerarse aceptable para producción. La función de pérdida también debe estar minimizada para garantizar el óptimo rendimiento del modelo antes de su implementación.
¿Cómo exportar y utilizar el modelo entrenado?
Finalizado el entrenamiento y evaluación, tienes dos opciones para utilizar el modelo. Puedes exportarlo para realizar predicciones en batch o implementarlo en la nube para hacer predicciones en tiempo real a través de una API. Estas funcionalidades expanden significativamente el impacto que el modelo puede tener en aplicaciones o servicios en tiempo real, maximizando el valor que se obtiene de los datos analizados.
¡Estamos seguros de que con estas instrucciones podrás concluir tu laboratorio con éxito, adquiriendo habilidades valiosas en el uso de AutoML!