Tipos de datos

5/25
Recursos

Aportes 42

Preguntas 12

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Deepnote recientemente liberó una manera avanzada de visualizaciones sin código en las celdas del notebook, esta funcionalidad fue liberada luego de grabar este curso, es decir no existía al momento de grabar esta clase, les dejo el link del video que ellos hicieron para publicar este update del producto: https://www.youtube.com/watch?v=3PhEO41WVLQ

Poner Deepnote en dark mode
En su documentación oficial mencionan que actualmente no tienen un dark mode desarrollado, pero esperan tenerlo en un futuro cercano. Mientas tanto, recomiendan instalar esta extensión y configurarla con estos valores:

  • Brightness +20
  • Contrast -20
  • Sepia off
  • Greyscale +15

.


Tip adicional: todas tus pestañas del navegador se verán así, por lo que te recomiendo usar Alt + Shift + D para activar y desactivar el dark mode de tu navegador (te será muy útil en cosas páginas como Deepnote o Drive, pero otras como Platzi, se ven mejor si lo desactivas)


.
El resultado será algo como esto:

Tipos de datos estadísticos

Datos categóricos

Los datos categóricos también conocidos como datos cualitativos, representan características como el género, el idioma, etc. de una persona. También pueden tomar valores numéricos, por ejemplo: 1 para mujeres y 0 para hombres. Hay que tener en cuenta que esos números no tienen significado matemático.
Los tipos de datos estadísticos categóricos se clasifican en:
.

  • Datos nominales: Otros de los tipos de datos estadísticos son los que tienen valores nominales que representan unidades discretas y se usan para etiquetar variables que no tienen un valor cuantitativo.
    Estos datos no tienen un orden, aunque cambiara el orden de sus valores, no cambia su significado.

  • Datos ordinales: Los datos ordinales representan unidades discretas y ordenadas. Por lo tanto, es casi lo mismo que los datos nominales, excepto que su orden es importante.
    Las escalas ordinales generalmente, se usan para medir características no numéricas como la felicidad, la satisfacción del cliente, etc.

.

Datos numéricos

Estos tipos de datos estadísticos también se conocen como datos cuantitativos, y se refieren a una medida o recuento. Se clasifican de la siguiente manera:
.

  • Datos discretos: Los datos estadísticos son discretos cuando sus valores son distintos y separados. Es decir, cuando los datos sólo pueden tomar ciertos valores.
    Este tipo de datos no se puede medir, pero se pueden contar. Básicamente representan información que se puede clasificar.
  • Datos continuos: Los datos continuos representan mediciones y, por lo tanto, sus valores. no se pueden contar, pero se pueden medir. A su vez, estos se clasifican de la siguiente manera:
    • Datos de intervalo: Los datos de intervalo representan unidades ordenadas que tienen la misma diferencia . Por lo tanto, hablamos de datos de intervalo cuando tenemos una variable que contiene valores numéricos que están ordenados y donde conocemos las diferencias exactas entre los valores.

.

El problema con los datos de valores de intervalo es que podemos sumar y restar, pero no podemos multiplicar, dividir o calcular razones. Debido a que no existe un cero verdadero, no se pueden aplicar muchas estadísticas descriptivas e inferenciales.
.

  • Datos de relación: También son unidades ordenadas que tienen la misma diferencia. Los datos de relación son los mismos que los valores de intervalo, con la diferencia de que tienen un cero absoluto.

Por si no sabias:
JUPYTER. Son unos “cuadernos” o notebooks, en los que puedes programar por bloques. Como si escribieras un cuaderno. En una porcion, ejecutas una linea sin que tengas que correr todo el programa. Busca ANACONDA
KAGGLE. Es una web que tiene concursos para analistas de datos y programadores, tiene bases de datos de uso libre.
COLAB. Es el Jupyter de Google, es decir no descargas ni instalas nada, lo tienes todo en linea.
DEEPNOTE. Herramienta para crear trabajos en simultaneo con otros colaboradores con los que se pueden hacer cambios en tiempo real en tus lineas de codigo

Si quieres moverte mas rápido por los bloques de código, te invito a que revises la paleta de comandos que ofrece Deppnote, puedes acceder con ctrl+p , presionado Esc o dando click al icono de la parte inferior izquierda.

Se te desplegara un menu, es muy parecido a las jupyter notebook pero si tiene un par de diferencias para insertar celdas por debajo o encima. Dejo un pequeño resumen de los comandos mas utilizados a mi criterio.

  • ctrl + k añadir un bloque de código por encima del bloque actual
  • ctrl + j añadir un bloque de codigo por debajo del bloque actual
  • ctrl+enter ejecutar el bloque actual
  • alt + shift + flecha arriba mover un bloque arriba
  • alt + shift + flecha abajo mover un bloque abajo
  • ctrl + shift + D duplicar el bloque

.
vale la pena echarle un ojo 😄

Fun Fact: El Fundador del Proyecto Jupyter es colombiano, paisa.
Se llama Fernando Pérez, es Físico de la Universidad de Antioquía y además de eso, otro proyecto destacable dentro de la comunidad es IPython

Amigos les dejo el cheat sheet de ciencia de datos con PANDAS 😁

A medio curso descubrí este maravilloso canal donde te explican todo sobre el preprocesamiento de datos. Por tanto, se facilita tu camino en Deepnote. Descubre el porqué de sus comandos, su variedad y más. Espero te sirva

Pandas cheat sheets

  • Descarga la version completa en PDF dando click aca
  • Ve a la pagina oficial para conocer mas etalles
    .
  • Tipos de datos

    categoricos:

    ordinal: Cuando existe una relacion de orden entre las categorías

    Nominal: cuando no existe esta relacion

    Numéricos:

    discreto: ejemplo EDAD (enteros)

    Continuos: Ejemplo altura (decimales)

  • Normalmente cuando pandas categoriza a una variable como objeto significa que no hay números allí, es una variable textual

  • Los boléanos TRUE o FALSE también están en las variables categóricas

  • Las variables numéricas esta en int64 (formato por defecto para variables enteras) y float64( formato por defecto para las variables continuas)

Valores cualitativos:
Son valores que clasifican o ordenan un dato, ejemplo, color del cabello, sirven para caracterizar o señalar pertenencia de un dato.

  • Ordinales: Es para dar una sensacion de orden en ocasiones son numeros, pero pueden ser palabras tambien ejemplo : Malo, Regular, Bueno, Excelente. Van de menor a mayor calidad

  • nominal: Es para clasficar o indicar pertenencia a algo. Ejemplo: Genero, nacionalidad, color de preferencia.

Admiro mucho la calma con la que explica el docente y además la claridad de los conceptos.

Categórico == Datos que tienen categorías
Numérico == Datos que tienen un valor por su naturaleza

Alimentando la curiosidad, va mi código de la clase utilizando VSCode e instalando pandas en macOS Big Sur.

import pandas as pd

df = pd.read_csv('a-003-ksm-66.csv')
df = pd.DataFrame(df)
print(df)
print(df.dtypes)

Saludos

Reciban cálido saludo
De antemano muchas gracias por el esfuerzo y la calidad de las clases.
recomiendo que tengan un solo entorno / ambiente para desarrollar los talleres… deberia ser homogenea la arquitectura,
es decir. si vamos a estar en deepnote o anaconda o cmder. todos en el mismo entorno. soy data science de ibm - coursera y ellos todo lo tienen en una misma plataforma (anaconda).
todo el set de cursos se basa en la misma plataforma!!
no cambian!!!

Sdos y gracias

gracias

Deepnote es similar al R (R Studio)…

Yo pronunciaría en inglés, fonéticamente Jupyter como “yúpiter”.

No me quedé tan tranquilo con la definición de las subdivisiones de los datos, entonces investigué por ahí algo más amplio, les dejo lo que encontré por si a alguien le sirve:

Categóricos. Una variable categórica es una variable con un número limitado de valores distintos o categorías

  • Ordinal. Una variable puede tratarse como nominal cuando sus valores representan categorías sin clasificación intrínseca (por ejemplo, el departamento de la empresa en la que trabaja un empleado). Ejemplos de variables nominales incluyen la región, el código postal y la afiliación religiosa.

  • Nominal. Una variable puede ser tratada como ordinal cuando sus valores representan categorías con alguna clasificación intrínseca (por ejemplo, niveles de satisfacción de servicio de altamente insatisfecho a altamente satisfecho). Ejemplos de variables ordinales incluyen puntuaciones de actitud que representan grado de satisfacción o confianza y puntuaciones de calificación de preferencia.

**Numéricos. **

  • Discretos. El término discreto implica distinto o separado. Por lo tanto, los datos discretos se refieren al tipo de datos cuantitativos que se basan en los recuentos. Contienen solo valores finitos, cuya subdivisión no es posible. Incluye aquellos valores que solo se pueden contar en números enteros y están separados, lo que significa que los datos no se pueden dividir en fracciones o decimales. Por ejemplo: La cantidad de estudiantes en la escuela, la cantidad de autos en el estacionamiento, la cantidad de computadoras en un laboratorio de computadoras, la cantidad de animales en un zoológico, etc…

  • Continuos. Los datos continuos se describen como un conjunto de observaciones ininterrumpidas; Eso se puede medir en una escala. Puede tomar cualquier valor numérico, dentro de un rango finito o infinito de valor posible. Estadísticamente, el rango se refiere a la diferencia entre la observación más alta y más baja. Los datos continuos se pueden dividir en fracciones y decimales, es decir, se pueden subdividir significativamente en partes más pequeñas de acuerdo con la precisión de la medición. Por ejemplo, edad, altura o peso de una persona, tiempo necesario para completar una tarea, temperatura, tiempo, dinero, etc.

Antes de ver este curso ya usaba pandas. Entender que ahora el dtype de object no es un error sino que nos dice que es una variable categórica 😂

Otra forma de interpretar los tipos de datos son los tipos de variables y estas pueden ser: cuantitativas y cualitativas

    • CUALITATIVAS: son las que me indican cualidades, gustos, atributos, etc. Se pueden clasificar en nominales y ordinales.
  1. *Nominales: Son aquellas que me indican atributos, cualidades, etc sin expresar categorías superiores e inferiores, ejemplo: El genero, masculino, femenino. Método de pago: cash, debit card, credit card, etc.
  2. Ordinales: Son aquellas que me indican atributos, cualidades, etc de forma jerarquizada, de forma categórica. Por ejemplo: Estrato socioeconómico: bajo, medio, alto. Experiencia del usuario: buena, regular, mala. Cargos en una empresa: presidente, vicepresidente, gerente, coordinador, supervisor, etc.
  • CUANTITATIVAS: Son aquellas que se pueden “cuantificar”, que se pueden expresar mediante números. Por ejemplo, la edad: 15, 20, 50, 67. Altura: 170 cm, 200 cm, etc. Se pueden clasificar como discretas y continuas

Que clase tan buena.

Aunque el proyecto en deepnote esta compartido, recomiendo hacerlo uno mismo

  1. Nos da un conocimiento del deepnote
  2. Ejecutamos las instrucciones, y es prueba y error es la que nos ayuda a aprender.

TIPOS DE DATOS

  1. Categóricos

    • Ordinal
    • Nominal
  2. Numéricos

    • Discretos
    • Continuos

there are two categories of data types, the first one is numeric data and the second one is categoric data, the numeric data have two subcategories, discreet data, and continuous data, discreet like the number of children in your family like 3, you can’t have 2,5 children, and continue as the weather 25.645562 (float). for categorical data, we have two subcategories too, ordinal y nominal, nominal describes a variable that does not have a natural order, and ordinal is one where the order matter but not the difference btw values.

⚠️ today we have more categories for numeric data: ration and interval

Muy buen inicio, tener muy claras las bases de los cursos anteriores a este

Datos categóricos: tambien llamados cualitativos son los que definen categorias, o caracteristicas no medibles, tambien pueden distiguirse porque no se pueden hacer operaciones algebraicas con estos:

  • Ordinal: Son aquellos donde el orden es representativo por ejemplo: Los niveles escolares, la etapa de una enfermedad, los lugares de una carrera, el grado militar, es decir todos aquellos datos donde el orden represente relevancia.

  • Nominales: Son todos aquellos datos donde el orden no es tan representativo, por ejemplo, el sexo, las clases sociales de una poblacion, el color del cabello, la raza de perritos, marcas de tenis…

Datos numéricos: Tambien se les llaman datos cuantitativos, son todos aquellos que podemos contar o definir numericamente.

  • Discretos: Son aquellos que podemos definir con numeros enteros naturales, por ejemplo la cantidad de autos q se fabrican digamos en un mes, cantidad de productos vendidos, cantidad de arboles cortados, numero de amigos o parejas sentimentales, votos por casilla…

  • Continuos: son todos aquellos datos que estan definidos en la recta real, por jemplo, el peso, la altura, el tiempo q tarda una persona ejercitandoes, los litros de agua gastados en tu casa, el consumo de eléctricidad en una fabrica, la distancia de los lineas de tensión…

PERO MUESTRALO COMO HACER NO ME FOTOS

TIPOS DE DATOS:

Categóricos:

  • Ordinal: Existe una jerarquita o relación de orden en las categorías
  • Nominal: No existe una jerarquita en las categorías

Numéricos:

  • Discretos: Entero, ej: La edad
  • Continuos: Decimal ej: La altura

Si quieren aprender mas sobre los entornos de trabajo como deepnote o google colab. Pueden revisar este curso

Maravillosa clase. Para seguir estudiando estadísticas.

Ojalá estas definiciones puedan ayudar a alguien.
.

Datos numéricos

Éste tipo de datos se relacionan con mediciones y pueden operarse matemáticamente.
.
Ejemplos: altura, temperatura, número de habitantes.
.

Datos numéricos discretos

Que los datos numéricos sean discretos significa que están restringidos de tal forma que entre dos de sus valores posibles no existe una cantidad infinita de otros posibles valores.
.
Usualmente este tipo de datos numéricos se asocian a los números enteros.
.
Ejemplos: años cumplidos, unidades despachadas, horas completas trabajadas.
.

Datos numéricos continuos

Que los datos numéricos sean continuos significa que entre dos valores cualquiera de éstos datos existe una cantidad infinita de otros posibles valores.
.
Usualmente este tipo de datos numéricos se asocian al conjunto de los números reales.

Tenemos 2 tipos de datos:

  1. Categóricos (género, categoría de película, método de pago) -> ordinal y nominal
  2. Numéricos (edad, altura, temperatura) -> discretos y continuos

A la librería Pandas se le conoce también como “El excel de Python”

Es genial la herramienta Deepnote

Deepnote es sencillamente maravilloso! Dificil volver al editor de codigo luego de conocerlo. 😃

Deepnote es demasiado bonito y facil de usar. Me gusta.

Qué bonito es Deepnote, sin duda alguna, mi nueva herramienta favorita.

Espero muchos más cursos con este profesor, explica todo con mucha claridad.

Hola,

Les comparto un artículo donde se describe la diferencia entre tipo de variables discretas y continuas. Aquí

Saludos!

Hola!
El curso claramente esta centrado en estadística descriptiva, sin embargo, les quiero compartir algunas cosas que aprendí del Curso de Manipulación y Análisis de Datos con Pandas y Python (acá la liga: https://tuit.es/gk31v). Si tu camino es la ciencia de datos y aunque no lo sea, te recomiendo muchísimo ese curso.

  1. Se puede generar una variable que almacene el path de donde estaremos tomando los archivos que estaremos revisando con ayuda de pandas y, con respecto a ese path y apoyados con la función format, podemos pasar el nombre del archivo que usaremos para cargar la variable de dataframe. Esto aplica en casos en donde los archivos tienen una ruta diferente al home de ejecución de nuestro programa/notebook

  2. El profe Pacho uso la función dtypes para obtener las características de los campos dentro del dataframe, podemos de igual forma hacer uso de la función info()

  3. El uso de describe realiza un filtro en donde sólo considera a los campos cuyo tipo de dato es numérico. Aquellos que forman parte de los datos categóricos (que aparecen en el listado como tipo object y bool), no están considerados dentro de las operaciones de describe. Podemos agregarlos, usando la función describe como >> describe(include = ‘all’), sin embargo, como no contienen valores con los cuales podamos realizar las operaciones matemáticas, nos retornara un valor nulo. Hay forma de que estos datos tomen sentido a las operaciones, ya que un dato categórico podría verse desde la perspectiva de base de datos como un valor de catálogo y, con ello, podemos realizar funciones de agrupación, por ejemplo, sin embargo, es posible que estos temas no formen parte del foco central de este curso y de ahí mi recomendación para profundizar en ello 😃

from icecream import ic
import pandas as pd

dir_pandas = './files/{}'

def run():
    df = pd.read_csv(dir_pandas.format('cars.csv'))
    ic(df.info())
    ic(df.dtypes)
    ic(df.describe())


if __name__ == '__main__':
    run()

Hey team, there’s my deepnote for the notes
Link

Por si la diferencia entre datos nominales y ordinales no quedó muy clara:

  • Nominales: No pueden ser ordenados. Por ejemplo: nombres, marcas, colores…
  • Ordinales: Consisten de grupos o categorías que siguen un orden estricto. Por ejemplo, escalas como:
    • de feo a delicioso
    • no me gusta - casi no me gusta - neutral - me gusta un poco - me gusta
    • nunca - casi nunca - ocasionalmente - casi siempre - siempre

Tipos de datos, ojo hay mas, pero estos son los principales

https://pandas.pydata.org/docs/user_guide/index.html
Documentación de Pandas, va a ser muy útil para manipular datos.