Hola… utilicé <code>None</code> en una columna de valores numéricos del DataFrame y me lo asignó como un <code>NaN</code>, pero al coloc...

Pregunta de la clase:
Manejo de datos nulos
Felipe Aníbal Torrejón Traslaviña

Felipe Aníbal Torrejón Traslaviña

Pregunta
studenthace 3 años

Hola… utilicé

None
en una columna de valores numéricos del DataFrame y me lo asignó como un
NaN
, pero al colocar un valor
NaN
en una Serie de datos no numéricos, no ocurre los mismo.

Busqué alguna explicación y encontré en este artículo que Pandas siempre homogeniza los datos, por el hecho de que las Series tienen valores del mismo tipo.

  • NaN
    es del tipo
    float64
    y
    None
    es un objeto de tipo
    NonType
    .
  • Cuando insertamos un valor
    None
    en una Serie de valores numéricos, Pandas lo transforma en
    NaN
    para ajustarlo al conjunto al que pertenece; y además, transforma la Serie a
    float64
    para ajustarlo al tipo de
    NaN
    .
  • Cuando insertamos
    NaN
    en un conjunto de datos no numéricos (Strings, booleanos…), Pandas no transforma el valor a
    None
    , si no que trata los datos como objetos e inserta el valor
    NaN
    ; lo mismo ocurre al incluir un valor
    None
    : todos los datos son vistos como objetos y se inserta
    None
    como tal.

La pregunta es: ¿Hay alguna diferencia en el tratamiento de datos no numéricos cuando nos enfrentamos a

NaN
y cuando nos enfrentamos a
None
?

2 respuestas
para escribir tu comentario
    Leandro Tenjo

    Leandro Tenjo

    studenthace 3 años

    También me confundí un poco.

    Y fíjate que al poner un

    NaN
    en una columna de enteros, los transforma todos a valores Float.



    • np.nan
      es tomado como ++Float++
    • pd.NA
      es tomado como ++Entero++
    • None
      es tomado como ++Texto++

    ↓ y a la vez todos representan ++Valores Nulos++

    Alarcon7a

    Alarcon7a

    studenthace 3 años

    en pandas se manejan y detectan de igual manera

Curso de Manipulación y Transformación de Datos con Pandas y NumPy

Curso de Manipulación y Transformación de Datos con Pandas y NumPy

Manipula y transforma grandes cantidades de datos numéricos y en tablas con dos de las librerías más utilizadas en data science: Pandas y NumPy. Crea y utiliza DataFrames y Arrays que te permitan analizar datos de forma sencilla.

Curso de Manipulación y Transformación de Datos con Pandas y NumPy
Curso de Manipulación y Transformación de Datos con Pandas y NumPy

Curso de Manipulación y Transformación de Datos con Pandas y NumPy

Manipula y transforma grandes cantidades de datos numéricos y en tablas con dos de las librerías más utilizadas en data science: Pandas y NumPy. Crea y utiliza DataFrames y Arrays que te permitan analizar datos de forma sencilla.