Almacenamiento de Predicciones con Google Cloud Storage y BigQuery

Clase 31 de 42 • Curso de Google Cloud Platform para E-commerce

Contenido del curso

Retail Store en Google Cloud Platform

Exposición de servicios con Apigee

Generación de modelos AI/ML

Consumo de servicios de AI/ML

Google Marketing Platform

Tomar examen

Resumen

Cuando ya tienes un modelo de machine learning funcionando y generando predicciones, el siguiente paso lógico es almacenar esos resultados para que sean útiles. Existen múltiples destinos posibles, pero dos opciones destacan dentro del ecosistema de Google Cloud: Google Cloud Storage y BigQuery. Ambas permiten guardar datos de forma eficiente, aunque cada una responde a necesidades distintas.

¿Qué es Google Cloud Storage y por qué usarlo para guardar predicciones?

Google Cloud Storage es el servicio de almacenamiento de objetos en la nube de Google. Su principal característica es que no distingue entre tipos de archivo: imágenes, videos, PDFs o cualquier otro formato son simplemente bytes que se persisten para resguardo o consumo posterior [01:00].

Una ventaja importante son las clases de almacenamiento. No toda la información tiene la misma urgencia ni demanda:

Almacenamiento estándar: acceso rápido para cualquier usuario.
Almacenamiento frío (coldline): pensado para backups o archivo muerto, con un costo mucho menor.

Incluso en almacenamiento frío, la recuperación toma apenas milisegundos, sin penalizaciones extremas en tiempo [01:52]. Si sabes que las predicciones de tu modelo no se consultarán de inmediato, esta opción reduce costos significativamente.

Además, puedes aplicar reglas de ciclo de vida a tus datos: eliminar archivos tras cierto número de días o migrarlos automáticamente entre clases de almacenamiento [02:22].

¿Cómo exportar predicciones a Cloud Storage con Python?

El proceso en Python requiere definir tres elementos clave [02:48]:

El nombre del bucket, que es el espacio de almacenamiento donde persistirás la información.
El nombre del archivo de salida, que puede ser CSV, JSON u otro formato.
La referencia al proyecto y dataset de BigQuery de donde provienen los datos.

Se utiliza un objeto llamado extract job, que es más complejo que una simple query. Debes especificar la tabla de referencia, la destination URI (el identificador que Cloud Storage usa para localizar archivos) y la ubicación geográfica del bucket [03:18].

Un detalle crítico: la ubicación de los datos en BigQuery debe coincidir con la ubicación del bucket destino. Si tus datos están en la Unión Europea, el bucket también debe estar ahí. Lo mismo aplica para Estados Unidos o cualquier otra región [03:52].

¿Cómo guardar predicciones directamente en otra tabla de BigQuery?

Si prefieres seguir aprovechando las capacidades analíticas de BigQuery, guardar las predicciones en otra tabla dentro del mismo servicio resulta incluso más sencillo [04:30].

De manera predeterminada, BigQuery guarda los resultados de cualquier consulta en una tabla temporal que vive máximo veinticuatro horas [04:52]. Para convertirla en permanente, solo necesitas agregar la configuración de tabla destino.

¿Qué pasos seguir para persistir en una tabla permanente?

El flujo es directo [05:05]:

Define un identificador de tabla con tu proyecto, dataset y el nombre que prefieras.
Crea un objeto QueryJobConfig y asígnale la tabla destino.
Arma tu sentencia SQL incluyendo la instrucción PREDICT.
Ejecuta el job con el cliente de BigQuery, pasándole la consulta y el jobConfig.

python table_id = "proyecto.dataset.nombre_tabla" job_config = bigquery.QueryJobConfig(destination=table_id) sql = "SELECT * FROM ML.PREDICT(MODEL proyecto.dataset.modelo, TABLE proyecto.dataset.datos)" query_job = client.query(sql, job_config=job_config) query_job.result()

Dentro del QueryJobConfig puedes agregar muchos más parámetros; la documentación de BigQuery detalla todas las posibilidades disponibles [05:48].

El resultado es que tus predicciones quedan persistidas en una tabla permanente, lista para análisis posteriores sin límite de tiempo. Esto permite que cualquier persona del equipo pueda consultar, cruzar y analizar esos resultados con SQL estándar.

Si quieres ver cómo se ejecuta todo esto en la consola de Google Cloud con código real, comparte tu experiencia y cuéntanos qué destino de almacenamiento se adapta mejor a tu caso de uso.

Almacenamiento de Predicciones con Google Cloud Storage y BigQuery

Retail Store en Google Cloud Platform

Google Cloud para Retail: Optimización y Modernización en E-commerce

MLOps: Integración y Operacionalización en Ciencia de Datos Retail

Arquitectura de Alto Nivel para Aplicaciones en la Nube

Desarrollo de Aplicaciones con Firebase y Vue: Configuración Inicial

Firebase: Autenticación y Seguridad en Aplicaciones Web

Instalación y Configuración de Google Cloud y Firebase para Apps

Medición de Interacciones con Google Tag Manager y Analytics

Configuración de Google Tag Manager y Google Analytics

Tageo Avanzado con Google Tag Manager para Customer Lifetime Value

Uso estratégico del Customer Lifetime Value (CLV)

Integración de Servicios y APIs en Arquitecturas Modernas

Exposición de servicios con Apigee

Integración de APIs en Tiendas en Línea

Fundamentos y Creación de APIs con APIG de Google Cloud

Creación y Gestión de APIs con APIG

Creación de API Proxy con APIG y OpenAPI Specification

Creación y Gestión de API Products y Developer Apps

Creación y gestión de portales para desarrolladores con APIG

Configuración de Portales para Desarrolladores en APIG

Buenas prácticas para desarrollar APIs eficaces

Generación de modelos AI/ML

Datos Estructurados en Machine Learning para Marketing

Modelos de Forecasting y Customer Lifetime Value con BigQuery

Integración de BigQuery con Jupyter para Análisis de Datos

Cuándo usar AutoML Tables vs BigQuery ML en Machine Learning

Entrenamiento de Modelos de Machine Learning con BigQuery ML

Entrenamiento y Evaluación de Modelos con BigQuery ML y Jupyter

Exportación de Modelos en BigQuery ML: Métodos y Consideraciones

Exportación de Modelos de Machine Learning a Cloud Storage

Consumo de servicios de AI/ML

Despliegue de Modelos Machine Learning en Google Cloud Run

Introducción a Kubernetes y su Uso en la Orquestación de Contenedores

Implementación de Modelos de Machine Learning con BigQuery API

Almacenamiento de Predicciones con Google Cloud Storage y BigQuery

Implementación de Modelos ML en BigQuery y Almacenamiento en GCS

Despliegue Continuo con Google Cloud: Herramientas y Estrategias

Despliegue Continuo en Google Cloud con Cloud Run y Docker

Configuración de Escalamiento en Google Cloud Run

Control de Autenticación y Autorización en Google Cloud Run

Google Marketing Platform

Google Cloud Platform para Estrategias de Marketing Digital

Integración de Google Analytics con BigQuery para Segmentación Avanzada

Análisis de Datos con SQL y Modelos K-Means en Google Analytics

Creación y Evaluación de Modelos en BigQuery con Datos de Google Analytics

Segmentación de Audiencias en BigQuery y Predicciones de Compra

Integración de Audiencias en Google Marketing Platform