Segmentación de Audiencias en BigQuery y Predicciones de Compra
Clase 41 de 42 • Curso de Google Cloud Platform para E-commerce
Resumen
¿Cómo se generan los centroides para los modelos de predicción?
Generar los centroides es una etapa fundamental en el análisis de datos y modelado predictivo. En este contexto, se han definido tres centroides para trabajar con los datos disponibles. ¿Por qué tres? Es una decisión basada en el diseño del modelo previamente entregado y operacionalizado en BigQuery por Antonio, un experto en la materia. Esto garantiza que cada grupo de datos tenga una representación precisa y útil en las predicciones futuras.
¿Qué datos se utilizan y cómo se operacionalizan?
El modelo proporcionado por Antonio ha facilitado la puesta en marcha del análisis, ya que está diseñado para trabajar con un conjunto específico de datos alojados en BigQuery. Estos datos se ordenan en tablas que contienen:
- User ID: Una identificación única proporcionada por Google Analytics para rastrear y identificar a los usuarios.
- Predicciones de compra: Probabilidades calculadas del comportamiento de compra de los usuarios.
- Información adicional: Datos adicionales que pueden complementar el análisis.
Lo fundamental aquí es la predicción de compra, que ha sido ajustada de acuerdo con la misma distribución usada para el modelado, maximizando así la precisión y relevancia de los datos.
¿Cómo se segmenta la tabla de predicciones?
Una vez alojados en BigQuery, los datos de predicciones se organizan de manera que permite su segmentación efectiva. Se cuentan con aproximadamente once mil registros que deben ser divididos para diferentes audiencias basadas en centroides. El proceso es el siguiente:
- Selección y ordenamiento: Se realiza una selección completa de los datos, priorizando los campos de identificación del usuario.
- Orden descendente: Los datos se ordenan en función de la probabilidad de compra, de manera descendente, para priorizar aquellos con mayor probabilidad de conversión.
- Limitación de registros: Se limita la salida a 3,600 registros, representando el segmento más valioso (audiencia VIP).
Se invita a los estudiantes a realizar sus propios queries para generar las audiencias para los otros dos centroides, fomentando así el aprendizaje activo y la práctica de las herramientas utilizadas.
¿Cómo se exportan y utilizan los datos generados?
Tras realizar el ajuste de la tabla en BigQuery, el siguiente paso es la descarga de los datos relevantes en un formato manejable, como CSV. Este archivo puede ser guardado tanto localmente como en Google Drive para facilitar su acceso y gestión. Este proceso es sencillo:
- Exportar los datos obtenidos a un archivo CSV.
- Guardar en Drive o en la computadora local.
El siguiente paso del proceso consiste en cargar estos datos en Google Marketing Platform (GMP), permitiendo una integración fluida y efectiva para la creación de campañas basadas en audiencias segmentadas. En la próxima etapa, se explicará cómo se realiza esta carga y activación de audiencias en DB3 SixT, profundizando en la maximización del valor de los datos para estrategias de marketing.
Aprender a manipular estos datos no solo refuerza las habilidades técnicas, sino que también abre puertas a oportunidades significativas en el ámbito del marketing digital y el análisis predictivo. ¡Continúa aprendiendo y no dudes en experimentar con estas técnicas!