Implementación de Modelos ML en BigQuery y Almacenamiento en GCS

Clase 32 de 42Curso de Google Cloud Platform para E-commerce

Resumen

¿Cómo invocar un modelo de machine learning en BigQuery?

La utilización de BigQuery para la implementación de modelos de machine learning se ha convertido en una técnica esencial para los analistas de datos y desarrolladores. BigQuery no solo permite almacenar grandes volúmenes de datos, sino que también facilita la construcción y explotación de modelos predictivos. Veamos paso a paso cómo se lleva a cabo el llamado a un modelo desde su consola.

¿Qué es Google Cloud Shell y cómo se activa?

Para iniciar con la implementación, utilizamos Google Cloud Shell, una potente herramienta que te permite tener una máquina virtual temporal ya lista con Debian. Es ideal para tareas administrativas y operativas dentro de Google Cloud.

  • Activación: Se puede activar fácilmente desde la consola de Google Cloud haciendo clic en "Activar el Google Cloud Shell".
  • Ventajas: Permite instalar componentes adicionales, ajusta cómodamente el tamaño del terminal.

¿Cómo trabajar con repositorios y editores en Google Cloud?

Contar con un repositorio bien gestionado es vital para el éxito de tus desarrollos. Google Cloud ofrece un editor mediante el cual puedes revisar y modificar tu código fácilmente.

  • Acceso al editor: A través de Google Cloud Shell, puedes ajustar el ancho para una visualización más clara.
  • Repositorios: Puedes tener acceso a repositorios públicos y solucionar cualquier problema de dependencias a medida que avanzas.

¿Qué consideraciones para trabajar con modelos en BigQuery?

Uno de los principales aspectos a tener en cuenta es la persistencia de datos en tablas de BigQuery, y aquí es donde se utilizan las funciones de predict.

# Ejemplo de llamada a modelo en BigQuery
# Creación de cliente y configuración
cliente = bigquery.Client()
fecha_ejecucion = datetime.datetime.now().strftime("%Y%m%d%H%M")
table_id = f"Proyecto.Personal_Test.Google_Curso_Platzi.tabla_prediccion_{fecha_ejecucion}"

# Configuración del job
job_config = bigquery.QueryJobConfig(destination=table_id)

# Ejecución de la query
query = """
    SELECT PREDICT(ModelName, [column1, column2])
    FROM DatasetName
    WHERE condition
    LIMIT 10
"""
job = cliente.query(query, job_config=job_config)
job.result()  # Espera a que el job finalice

print(f"Los resultados han sido guardados en la tabla {table_id}")

¿Cómo usar Cloud Run o servicios desplegados?

Cloud Run brinda la facilidad de desplegar aplicaciones containerizadas, ofreciendo un entorno ágil y escalable para la ejecución de tus servicios.

  • Despliegue de servicios: Se puede usar, por ejemplo, una aplicación Python con Flask para crear servicios web.
  • Implementación: La URL de Cloud Run te permite realizar requests que ejecuten y persistan predicciones.

¿Cómo consultar los resultados almacenados en BigQuery?

Una vez ejecutadas las predicciones y almacenadas en BigQuery, es fundamental verificar y usar esos datos:

  • Acceso a la consola de BigQuery: Desde la sección de Big Data en el menú de navegación de Google Cloud.
  • Consulta de tablas: Puedes visualizar los resultados y la estructura de la tabla, asegurando que los datos se almacenaron correctamente, con configuraciones que tú determinas, como reglas de expiración.

La combinación de estos poderosos servicios de Google Cloud empodera a los desarrolladores para no solo crear soluciones integrales de machine learning, sino también para persisitir datos de una manera eficiente y accesible para otros equipos colaborativos como marketing y producto. ¡Sigue adelante, el camino hacia la maestría en Google Cloud y Machine Learning está lleno de oportunidades!