Entiendo que los RDD sean inmutables, al estilo de las tuplas, pero con pandas siempre he podido modificar los DataFrames, porque dice qu...

Herman Castillo R

Herman Castillo R

Pregunta
studenthace 5 años

Entiendo que los RDD sean inmutables, al estilo de las tuplas, pero con pandas siempre he podido modificar los DataFrames, porque dice que también son inmutables?

2 respuestas
para escribir tu comentario
    Daniel Eduardo Portugal Revilla

    Daniel Eduardo Portugal Revilla

    studenthace 4 años

    exacto, como nos dice Efren. no es lo mismo Pandas y Spark, por casualidades comparten el nombre Dataframe.

    Spark está orientado a programación funcional. hay un muy buen curso en Platzi sobre este tema donde se aprende el concepto de inmutabilidad

    Efren Bautista L.

    Efren Bautista L.

    studenthace 4 años

    Los Dataframes de pandas no son lo mismo que los Dataframes de Spark, son cosas distintas, solo se llaman igual y parecen igual en estructura visual, pero en el transfondo son distintos, los de spark se respaldan con la estrutura de los RDD´s por lo que heredan ciertas caracteristicas.

Curso de Fundamentos de Spark para Big Data

Curso de Fundamentos de Spark para Big Data

Aprende a manejar grandes volúmenes de datos con Apache Spark. Crea procesos ETL, trabaja con RDDs y DataFrames, optimiza consultas y aprende sobre la persistencia y particionado para mejorar el rendimiento en Big Data.

Curso de Fundamentos de Spark para Big Data
Curso de Fundamentos de Spark para Big Data

Curso de Fundamentos de Spark para Big Data

Aprende a manejar grandes volúmenes de datos con Apache Spark. Crea procesos ETL, trabaja con RDDs y DataFrames, optimiza consultas y aprende sobre la persistencia y particionado para mejorar el rendimiento en Big Data.