Cloud Dataflow
.
Es un servicio de procesamiento de datos totalmente administrado, que simplifica el desarrollo y la administración de flujos y pipelines.
-
Acelera el desarrollo de streaming y bach
-
Gestion y operaciones simplificadas
-
Construir sobre una base para machine learning
.
Posee templates que ya tienen armado un flujo de trabajo con determinado origen y determinado destino.
.
Tipos de pipelines:
.
Tiempo real: todos los datos van siendo procesados en el momento (Pub/Sub – Dataflow)
Scheduled Batch: primero se acumulan los datos, y luego se programa el procesamiento de los mismos, generalmente en las noches (Dataflow)
Triggered Batch: cuando tengo determinadas señales en mis datos, eso dispara o activan un flujo de ingesta de datos (Cloud Functions)
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?