Crear y predecir con BigQuery Machine Learning

Clase 22 de 28Curso de Machine Learning para Análisis Predictivo

Contenido del curso

Machine Learning genérico

Resumen

¿Cómo construir un modelo utilizando Vic Query para predicciones?

Explorar el mundo de la inteligencia artificial puede ser emocionante, especialmente cuando se trata de crear modelos que puedan predecir comportamientos futuros basados en datos históricos. En esta guía, vamos a detallar cómo construir un modelo de regresión lineal utilizando Vic Query, un superconjunto del lenguaje SQL. Esto te permitirá realizar predicciones precisas y mejorar la toma de decisiones en tu negocio o proyecto.

¿Qué es un modelo de regresión lineal y cómo se configura?

La regresión lineal es una técnica fundamental en estadísticas y machine learning. Se utiliza para predecir un valor numérico a partir de datos históricos. En este caso, queremos predecir el número de botellas que se venderán en una tienda.

Para configurar el modelo en Vic Query:

CREATE ML MODEL WITH ( NAME ‘Modelo_botellas’, TYPE 'LINEAR_REGRESSION', TARGET 'Cantidad_botellas' ) AS SELECT Cantidad_botellas, Tamaño_botella, Categoría, Fecha, Origen FROM dataset_name WHERE Cantidad_botellas < 3 AND Categoría IS NOT NULL AND Tamaño_botella > 0 AND Fecha < '2015-01-31';
  1. Define el nombre del modelo y el tipo como LINEAR_REGRESSION.
  2. Selecciona las columnas y el conjunto de datos que formarán parte del entrenamiento.
  3. Añade filtros para asegurar que los datos sean coherentes, como eliminar valores nulos o fuera de rango.

¿Cómo evaluamos el modelo creado?

Una vez que el modelo ha sido entrenado, es vital evaluarlo para asegurarnos de que su rendimiento es aceptable.

SELECT EVALUATE MODEL 'Modelo_botellas', IGNORE_BUILDER_OPTIONS FROM dataset_name WHERE Cantidad_botellas < 3 AND Categoría IS NOT NULL AND Tamaño_botella > 0 AND Fecha < '2015-01-31';
  • Usa el comando EVALUATE MODEL para generar métricas de evaluación como
    • Error medio cuadrático (Mean Squared Error - MSE)
    • Error medio absoluto (Mean Absolute Error - MAE).

Estas métricas te permiten conocer la precisión del modelo, en este caso, con una pérdida de 0.24, lo cual es razonablemente bueno para una primera iteración.

¿Cómo empezar a predecir con el modelo?

Llega la fase más esperada: las predicciones. Aquí es donde el poder de tu modelo cobra vida.

SELECT SUM(Predict(MODEL 'Modelo_botellas')) AS Predicción, Categoría, Condado FROM dataset_name WHERE Tamaño_botella > 750 AND Categoría = 'whisky' GROUP BY Categoría, Condado ORDER BY Predicción DESC;
  • Utiliza Predict() sobre el modelo para realizar predicciones.
  • Puedes agrupar los resultados por categorías y geografías para obtener insights accionables sobre qué condado comprará más de cada tipo de bebida.

Recomendaciones prácticas

  • Siempre limpia tus datos antes de entrenar el modelo para obtener predicciones más precisas.
  • Evalúa tus modelos periódicamente y ajústalos según sea necesario para mantenerse al día con los cambios en los datos.
  • Explora diferentes tipos de modelos más allá de la regresión lineal para problemas complejos.

Con estas herramientas y técnicas, estarás preparado para modelar tus datos y hacer predicciones exactas que impulsen tu proyecto hacia el éxito. Recuerda, la práctica constante y el análisis crítico de tus modelos llevarán a resultados cada vez más confiables y útiles. ¡Adelante, el mundo de la analítica predictiva te espera!