No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Curso de Fundamentos de Spark para Big Data

Curso de Fundamentos de Spark para Big Data

Óscar Gutiérrez Castillo

Óscar Gutiérrez Castillo

Comprendiendo la persistencia y particionado

23/25
Recursos

Aportes 8

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Interesante clase

interesante

Gran clase!!

from pyspark.storagelevel import StorageLevel

# Para saber si está almacenado en cache?
# Cada vez que llame los valores se debe traer la info desde la fuente 
medallista.is_cached


# Para guardarlo en cache
medallista.rdd.chache()

# Para ver en que forma se persiste la información
medallista.rdd.getStorageLevel()

# Para quitar una persistencia
medallista.rdd.unpersist()


# Para aplicar una persistencia
# Es una replica de todo el RDD
medallista.rdd.persist(StorageLevel.MEMORY_AND_DISK_2)

#Para crear un particionamiento
StorageLevel.MEMORY_AND_DISK_3 = StorageLevel(True,True,False,False,3)

# Aplicar la persistemcia creata
medallista.rdd.persist(StorageLevel.MEMORY_AND_DISK_3)