Google Cloud Bigtable

7/16
Recursos

Aportes 12

Preguntas 3

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Google Cloud Bigtable

Cloud Bigtable es el servicio de base de datos de Big Data NoSQL de Google, completamente administrado a escala de patabytes para casos de uso en los que el acceso de datos aleatorios de baja latencia, la escalabilidad y la confiabilidad son fundamentales

  • Características

    • Alto procesamiento
    • Procesamiento de baja latencia
    • Cantidades muy grandes de datos
    • Cambios de tamaño sin tiempo de inactividad
    • Replicación flexible y automatizada
    • Google Search, Maps y otros productos de Google
  • ¿Cómo interactuamos con Cloud Big Table?

    • Api de aplicación: Podemos leer y escribir datos atraves de una capa de servicio llamada rede Hbase, que es un gestor de codigo abierto que nos ayuda exponer el point que nos proveen estas operaciones de escribir leer actualizar y borrar y esto se usa normalmente para enviar datos a las aplicaciones o paneles de control
    • Streaming / Transmisión: Datflow Streaming, Saprk Streaming y Apache Storm
    • Batch Processing / Procesamiento por lotes: Los datos se pueden leer y escribir en Big Table en forma de batch (cantidades grandes) esto se puede hacer a través de hadoop, Datflow, Apache Spark.

BigTable, MapReduce, BigQuery son de los proyectos más importantes para en el surgimiento del procesamiento distribuido. sus paper dieron origen a tecnologías como Hadoop, Spark, Hbase, Cassandra. les dejo una buena infografia
https://cloud.google.com/blog/topics/developers-practitioners/how-big-cloud-bigtable

Cloud Bigtable es ideal para almacenar grandes cantidades de datos con una latencia muy baja. Admite alta capacidad de procesamiento en lectura y escritura por lo que es una opción ideal para aplicaciones operacionales y analíticas incluyendo IoT (Internet de las Cosas) y análisis de usuarios o de datos financieros. Se ofrece con la misma API de código abierto que HBase que es la base de datos nativa del proyecto Apache Hadoop.

Cuando Utilizar SQL: Cuando ya sabes la cantidad de usuarios que vas a tener y no vas a tener un crecimiento acelerado, tienes previsto el crecimiento.

Cuando Utilizar NoSQL: Cuando la base da datos es muchísima, los picos son muy altos y el crecimiento muy acelerado.

Cloud Bigtable es un servicio de base da datos NoSQL que avanza a Petabytes si es necesario 😲

Me encanta hasta ahora este curso, muy interesante!

SQL y NoSQL son dos tipos de bases de datos que tienen diferentes enfoques para almacenar y acceder a los datos.

SQL, o Structured Query Language, es un lenguaje de consulta estándar para bases de datos relacionales. Las bases de datos relacionales almacenan datos en tablas, que están compuestas por filas y columnas. Cada fila representa una entidad, como un cliente o un producto, y cada columna representa un atributo de esa entidad, como el nombre o el precio.

NoSQL, o No-Relational Database, es un término general para las bases de datos que no siguen el modelo relacional. Las bases de datos NoSQL se utilizan para almacenar datos de diferentes tipos y estructuras, como datos estructurados, semiestructurados y no estructurados.

Las principales diferencias entre SQL y NoSQL son las siguientes:

Modelo de datos: Las bases de datos SQL utilizan un modelo de datos relacional, mientras que las bases de datos NoSQL utilizan diferentes modelos de datos, como documentos, clave-valor, gráficos o columnas anchas.
Lenguaje de consulta: Las bases de datos SQL utilizan el lenguaje SQL para consultar los datos, mientras que las bases de datos NoSQL utilizan diferentes lenguajes de consulta.
Desempeño: Las bases de datos NoSQL suelen ofrecer un mejor rendimiento para consultas de datos no relacionales, mientras que las bases de datos SQL suelen ofrecer un mejor rendimiento para consultas de datos relacionales.
Flexibilidad: Las bases de datos NoSQL son más flexibles que las bases de datos SQL, ya que no requieren que los datos se estructuren de una manera específica.
Escalabilidad: Las bases de datos NoSQL suelen ser más escalables que las bases de datos SQL, ya que se pueden distribuir en múltiples servidores.
¿Cuándo usar SQL?

Las bases de datos SQL son una buena opción para aplicaciones que requieren un alto rendimiento para consultas de datos relacionales. Las bases de datos SQL también son una buena opción para aplicaciones que requieren una integridad referencial estricta.

¿Cuándo usar NoSQL?

Las bases de datos NoSQL son una buena opción para aplicaciones que requieren flexibilidad, escalabilidad o almacenamiento de datos no relacionales. Las bases de datos NoSQL también son una buena opción para aplicaciones que requieren un alto rendimiento para consultas de datos no relacionales.

Aquí hay algunos ejemplos de cómo se utilizan SQL y NoSQL:

SQL se utiliza a menudo para aplicaciones de gestión de clientes, como sistemas de ventas y CRM.
NoSQL se utiliza a menudo para aplicaciones de big data, como análisis de datos y procesamiento de transacciones en línea (OLTP).
SQL se utiliza a menudo para aplicaciones web, como sitios de comercio electrónico y blogs.
NoSQL se utiliza a menudo para aplicaciones móviles, como aplicaciones de redes sociales y juegos.
En última instancia, la mejor manera de decidir si usar SQL o NoSQL es evaluar las necesidades específicas de su aplicación.

Bigtable es una base de datos NoSQL distribuida y de alto rendimiento desarrollada por Google. Se utiliza para almacenar y gestionar grandes cantidades de datos, siendo especialmente adecuada para aplicaciones que requieren una escalabilidad masiva y un alto rendimiento, como aplicaciones web a gran escala y análisis de datos en tiempo real.

SQL vs NoSQL ¿Cuál elegir?

Ambos estilos de almacenamiento nos definen a la información y dependiendo de su sujeto (PostgreSQL, MongoDB, ElasticSearch, etc.), nos permitirán crear servicios / soluciones / productos bajo ciertos contextos.
.
El uso de SQL, mediante una base de datos relacional, se sugiere cuando la información será almacenada en registros o categorizadas.
.
Por su parte, el uso de NoSQL, mediante una base de datos documental por ejemplo, sugiere cuando la información será concentrada en volúmenes e interesa su incremento en estructura más que en registros.
.
Por último, cada base de datos abstrae un concepto y engine diferente permitiendo generar alta viabilidad de nuestra información y su costo será evaluado mediante la capacidad, transacción de lectura / escritura y de su latencia.
.

La latencia es un término de red para describir el tiempo total que tarda un paquete de datos, es decir, latencia = retraso.

**casos de uso comunes de Google Cloud Bigtable:** * **Análisis en tiempo real:** la velocidad y escalabilidad de Bigtable lo hacen ideal para procesar y analizar grandes flujos de datos en tiempo real. * **Bases de datos operativas:** Bigtable puede almacenar y administrar de manera eficiente datos operativos para aplicaciones que requieren acceso y actualizaciones rápidos, como datos de usuarios, datos de sensores o transacciones financieras. * **IoT (Internet de las cosas):** Bigtable puede manejar el gran volumen y velocidad de datos generados por los dispositivos IoT, lo que permite análisis e información de datos en tiempo real. * **Redes sociales:** Bigtable puede almacenar y gestionar grandes cantidades de datos de redes sociales, incluidos perfiles de usuario, fuentes de actividad y mensajes. * **Agregación de registros:** Bigtable puede recopilar, almacenar y analizar de manera eficiente datos de registros de diversas fuentes con fines de resolución de problemas, monitoreo y seguridad. **Comparado con el almacenamiento en la nube:** Si bien ambos son servicios de Google Cloud Platform, Cloud Storage y Bigtable tienen propósitos distintos. Cloud Storage sirve principalmente para almacenar objetos como archivos, imágenes y vídeos, mientras que Bigtable destaca en la gestión de conjuntos de datos grandes, estructurados o semiestructurados con necesidades de acceso rápido.