No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Conversión de valores faltantes implícitos en explícitos

9/21
Recursos

Aportes 12

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Estrategia para la identificacion de valores faltantes implicitos

  • Pivotar la tabla de datos. Pivotar es tomar una columna de referencia sobre la cual se quiere extender sus categorias de manera que muestre una nueva visualizacion de los datos
(
    implicit_to_explicit_df
    .pivot_wider(
        index="name",        # variable nombre como filas
        names_from="time",   # variable time como columnas
        values_from="value"  # variable value como valores de la tabla
    )
)
  • Cuantificar ocurrencias de N-tuplas
(
    implicit_to_explicit_df
    .value_counts(
        subset=["name"]   # cuenta los valores asociados a los nombres
    )
    .reset_index(name="n")  # asigna n como indice del conteo
    .query("n < 3")         # condicion a cumplir por n para que se muestre en la tabla
)

Algo curioso es que por mi parte no encontre la funcion .

pivot_wider 

Pero la que si enocontre fue la sieguiente, donde lo unico que cambia es que el campo names_from se llama colums y el campo values_from se llama values.

pd.pivot(data = implicit_to_explicit_df,
    index="name",        # variable nombre como filas
    columns="time",   # variable time como columnas
    values="value"  # variable value como valores de la tabla
)

Implícito se refiere a todo aquello que se entiende que está incluido
pero sin ser expresado de forma directa o explícitamente.”

Un valor faltante implícito indica que el valor faltante debería estar incluido en el conjunto de datos del análisis, sin que éste lo diga o lo especifique. Por lo general, son valores que podemos encontrar al pivotar nuestros datos o contabilizar el número de apariciones de combinaciones de las variables de estudio.

Dataframe de valores implícitos:

implicit_to_explicit_df = pd.DataFrame.from_dict(
    data={
        "name": ["lynn", "lynn", "lynn", "zelda"],
        "time": ["morning", "afternoon", "night", "morning"],
        "value": [350, 310, np.nan, 320]
    }
)

implicit_to_explicit_df

Esta clase me dejo viendo el mundo de otra forma jajajaja

📢 Explícito y implícito

  • “Explícito” es algo que se dice o se muestra de manera clara y directa, sin dejar lugar a dudas. Es decir, es algo que se expresa abiertamente y sin rodeos.
  • Por otro lado, “implícito” se refiere a algo que no se dice o se muestra de forma directa, sino que se da a entender de manera indirecta o sugerida. Es decir, es algo que no está explícitamente expresado, pero se puede deducir o inferir a partir de lo que se dice o se muestra.

Por ejemplo

Si te digo “tengo hambre, ¿quieres ir a comer algo conmigo?”, la invitación a comer algo es explícita, ya que se dice de manera directa. Pero si te digo “tengo hambre, qué bien huele ese restaurante”, la invitación no está expresada de forma directa, pero se puede entender implícitamente que te estoy invitando a comer en ese restaurante.

Por si les sale el warning: ``` FutureWarning: This function will be deprecated in a 1.x release. Please use `pd.DataFrame.pivot` instead. return method(self.\_obj, \*args, \*\*kwargs) ``` Les paso el código con pivot: ``` implicit\_to\_explicit\_df.pivot(index='name', columns='time', values='value').reset\_index() ```
Por si les da el warning ```js FutureWarning: This function will be deprecated in a 1.x release. Please use `pd.DataFrame.pivot` instead. return method(self._obj, *args, **kwargs) ```Les paso el código con pivot ```js implicit_to_explicit_df.pivot(index='name', columns='time', values='value').reset_index() ```
¿Será que lo de Lynn y Zelda es una referencia al poderosísimo The Legend of Zelda? ![](https://static1.thegamerimages.com/wordpress/wp-content/uploads/2019/02/LZ-fi-3.jpg)

genial!

excelente

Como pivotar la tabla de datos

(
    implicit_to_explicit_df
    .pivot_wider(
        index="name", # mantenerlos como id's de cada fila
        names_from="time", # valores a crear como col's
        values_from="value" # quermos rellenarlo y toma los valores de la colunma...
    )
) 

Cuantificar ocurrencias de n-tuplas

Ventaja: se puede combinar las variables que quieras( no siempre será una matriz)