Es atribuida a Nathan Marz. Se diseñó como una arquitectura escalable, tolerante a fallos y de alto procesamiento de datos.
Esta arquitectura buscaba satisfacer necesidades de procesamiento de datos en altas cantidades.
Se compone de tres capas: Batch, Serve y Speed.
- Batch: En esta capa vamos a procesar toda la información almacenada con anterioridad, desde el dÃa anterior hasta meses.
- Serve: Dentro de esta capa es posible visualizar la información procesada desde la capa batch.
- Speed: Conforme llega la información se va a ir procesando.
En esta arquitectura, podemos ver que se hace uso tanto de la capa Batch como de la capa Speed (las cuales están enfocadas al mismo objetivo general: alimentar otro servicio), y al tenerlas combinadas, se aumenta la complejidad en cuanto a cargas de administración. Sin embargo, esta arquitectura es bastante usada, y puede ser aprovechada manejando las capas Batch y Serve para datos que puedan ser tratados de manera histórica, y trabajar en la capa Speed información que requiera ser procesada y visualizada en tiempo real, todo en un mismo proyecto. Aunque muchas veces sólo es utilizada una o dos de las tres capas que tenemos disponibles en esta arquitectura.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?