Procesamiento de datos: pipelines, Apache Spark y cómputo paralelo