No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Introducción a Big Data

14/24
Recursos

Existen múltiples soluciones dentro de GC para el manejo de grandes cantidades de información:
• Uno de los componentes más antiguos de GC es BigQuery.
• Data Proc está orientado al manejo de información en procesamiento paralelo.
• Dataflow es una herramienta de conectividad o de integración.
• Pub/Sub es un sistema de mensajería orientado a detectar eventos o llamadas que disparen acciones que ejecuten procesos automáticos dentro de GC.
• Cloud Datalab está orientado a análisis de información.

Aportes 19

Preguntas 0

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

El curso requiere una actualización de contenido urgente.

A la fecha hay mas servicios que se deben tener en cuenta.
Deberían actualizar el curso por lo menos esta sección.

Big Data

  • Orientada a utilizar volumen de informacion muy amplias o grandes cantidades de información
  • Son utilizadas por medio de Base de Datos
  • Big Query, es de uno de los componentes mas antiguos
  • Data Proc está orientado al manejo de información en procesamiento paralelo.
  • Dataflow es una herramienta de conectividad o de integración.
  • Pub/Sub es un sistema de mensajería orientado a detectar eventos o llamadas que disparen acciones que ejecuten procesos automáticos dentro de GC.
  • Cloud Datalab está orientado a análisis de información.

Urgentemente una actualización del Curso. Nos estamos perdiendo material que vale Oro con Google Cloud Platform.!

Actualmente existen los siguientes servicios en Big Data de GCP: Composer, dataproc, Pub/Sub, Dataflow, IoT Core, BigQuery, data catalog, Data Fusión, Healthcare, Life sciences, dataprep

Deberían estar actualizados, hay mas temas que abarcan BigData

Falta actualización de info

Pub/sub es lo que se usa en las aplicaciones para enviar notificaciones a los suscriptores de algún servicio?

En la solucion de Big Data - Analisis de Datos ofrece diferentes soluciones para todos los tipos:

  • BigQuery:Comprende tus datos mediante un almacén de datos con alta escalabilidad y completamente administrado que integra AA.

  • Cloud Composer: Crea, programa, supervisa y administra los flujos de trabajo con un servicio de organización completamente administrado que está basado en Apache Airflow.

  • Dataflow: Desarrolla canalizaciones de procesamiento de datos de transmisión y por lotes en tiempo real.

  • Cloud Data Fusion: Crea y administra con rapidez las canalizaciones de datos con la integración de datos sin código y completamente administrada mediante una interfaz gráfica.

  • Dataprep de Trifacta: Explora, limpia y prepara los datos para analizarlo

  • Dataproc: Realiza transmisiones, consultas y procesamiento por lotes con un servicio administrado de Apache Spark y Hadoop.

  • Google Data Studio: Crea informes con los datos para tomar mejores decisiones comerciales.

  • Pub/Sub: Transfiere transmisiones de eventos desde cualquier lugar, a cualquier escala.

  • Data Catalog: Descubre y comprende los datos con un servicio escalable de administración de metadatos y descubrimiento de datos completamente administrado.

  • Cloud Life Sciences: Procesa, analiza y anota datos genómicos y biomédicos a gran escala mediante flujos de trabajo en contenedores.

ES NECESARIO TENER TARJETA DE CREDITO PARA CREAR UNA CUENTA

El servicio de Big Data de GCP contiene muchos mas contenidos ahora. El curso debe actualizar esta seccion.

Ya no existe cloud datalab

😃

Google Cloud Platform tiene herramientas pensadas en el Big Data.

Pub/Sub: sistema de mensajería, principalmente orientado a detectar llamadas o eventos, y éstos puedan disparar acciones.

Sorprendente

resumen

Introducción a Big Data

Existen múltiples soluciones dentro de GC para el manejo de grandes cantidades de información:
• Uno de los componentes más antiguos de GC es BigQuery.
• Data Proc está orientado al manejo de información en procesamiento paralelo.
• Dataflow es una herramienta de conectividad o de integración.
• Pub/Sub es un sistema de mensajería orientado a detectar eventos o llamadas que disparen acciones que ejecuten procesos automáticos dentro de GC.
• Cloud Datalab está orientado a análisis de información.

Actualización!!!