Integración de datos con BigQuery y Data Studio

7/19
Recursos

Aportes 11

Preguntas 2

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

Muy interesante el curso, me sorprende lo fácil y rápido que pueden generarse reportes y utilizar las herramientas de GCP.

Si no pueden agregar el bigquery-public-data como lo hizo el profesor intenten escribiendo en type search un dataset especifico, por ejemplo google_cloud_release_notes, luego den enter y les mostrará ese dataset especifico dentro de bigquery-public-data. Ahora solo den fijar (pin) a bigquery-public-data (no al dataset especifico) y cierren la busqueda que hicieron. Al cerrar ya tendran disponible bigquery-public-data con todos los data sets.

Recuerden tambien habilitar la API.

Si tienes problemas para añadir el dataset, esto es algo que otros ya explicaron pero no se entiende, aquí dejo la página que lo explica con imágenes.

---->Solución<-------

Si el dataset no se te agrega como al profesor, probá con estos pasos:
.

Como abrir un conjunto de datos públicos

Los conjuntos de datos públicos de BigQuery se muestran de forma predeterminada en la consola de Cloud.
.
Para abrir los conjuntos de datos públicos, sigue estos pasos:
.

  1. En la consola de Cloud, ve a la página de BigQuery.

  2. En el campo Tipo de búsqueda, ingresa bigquery-public-data.

Si no se muestra el proyecto, ingresa bigquery en el campo de búsqueda y, luego, haz clic en Ampliar la búsqueda a todos los proyectos para que coincida con la string de búsqueda con los conjuntos de datos existentes.

  1. Para fijar el conjunto de datos bigquery-public-data a tu proyecto, haz clic en Hacer clic para fijar.

  2. Para continuar, borra el campo de búsqueda.

  3. Para ver los conjuntos de datos subyacentes, expande el conjunto de datos bigquery-public-data.

Para abrir un conjunto de datos subyacente y ver sus detalles, haz clic en Más acciones > Abrir a fin de abrirlo y ver sus detalles.
.
.
Tambien hay otras cosas para comprobar, como facturación, o ver si la API de BigQuery está habilitada, que las podés ver acá

El error en el minuto 4:50 es porque selecciono una parte del query, suele suceder, es mejor dar clic al final del query

Recuerden que cada query tiene un costo de procesamiento en GCP. Para reducir estos costos se puede optimizar los queries. En la documentación de GCP muestran ejemplos de ¿cómo optimizarlos?

https://cloud.google.com/bigquery/docs/best-practices-performance-overview?hl=es-419

Muy intuitiva de usar

Les comparto un conjunto de recomendaciones para iniciar con BigQuery:
https://towardsdatascience.com/top-12-advice-on-bigquery-and-sql-for-beginners-cc82924ca60b

Es importante recordar que consultar tiene costo, así que tengamos presente:

  • Usar comodín (asterisco *) lo menos posible en nuestras consultas y traigamos las columnas que nos interesan
  • LIMIT no reduce el costo en casos corrientes, a menos que se trate de tablas clusterizadas
  • Tratar de reducir los datos antes de JOINs y filtrar efectivamente con WHERE trae muchas ventajas

Y estar pendientes que la interfaz nos informa qué tanta información aproximadamente puede estar trayendo la consulta

estupendo, anexe el atasets, muy facil.

Increíble herramienta BigQuery para el análisis de datos, es genial ver cuantas aplicaciones puede tener herramientas como esta.

me sali todo muy bien creo que esta genial