Óscar menciona correctamente que los DF son inmutables en Spark, sin embargo, para algunos el hacer la siguiente operación, resulta confuso:
deportistaOlimpicoDF=deportistaOlimpicoDF.withColumnRenamed("genero","sexo")\
.drop("altura")
A simple vista da la impresión que estamos modificando el DF: deportistaOlimpicoDF
, renombrando una columna y eliminando otra. Esto no es verdad, en realidad se está creando una copia del DF original: deportistaOlimpicoDF
,
Les comparto éste excelente enlace dónde explican ésta casuística.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?