Cloud Dataflow

5/19
Recursos

Aportes 2

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

o inicia sesión.

Que es un Cloud Dtaflow
Es un servicio de procesamiento de datos totalmente administrado que simplifica el desarrollo y la administración de flujos y pipelines.
-Acelera el desarrollo de streaming y bach
-Gestion y operaciones simplificadas
-Construir sobre una base para machine learning

Cloud Dataflow

.
Es un servicio de procesamiento de datos totalmente administrado, que simplifica el desarrollo y la administración de flujos y pipelines.

  • Acelera el desarrollo de streaming y bach

  • Gestion y operaciones simplificadas

  • Construir sobre una base para machine learning
    .

Posee templates que ya tienen armado un flujo de trabajo con determinado origen y determinado destino.
.

Tipos de pipelines:

.
Tiempo real: todos los datos van siendo procesados en el momento (Pub/Sub – Dataflow)
Scheduled Batch: primero se acumulan los datos, y luego se programa el procesamiento de los mismos, generalmente en las noches (Dataflow)
Triggered Batch: cuando tengo determinadas señales en mis datos, eso dispara o activan un flujo de ingesta de datos (Cloud Functions)