Crea una cuenta o inicia sesi贸n

隆Contin煤a aprendiendo sin ning煤n costo! 脷nete y comienza a potenciar tu carrera

Tipos de datos

5/25
Recursos

Aportes 64

Preguntas 21

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

Deepnote recientemente liber贸 una manera avanzada de visualizaciones sin c贸digo en las celdas del notebook, esta funcionalidad fue liberada luego de grabar este curso, es decir no exist铆a al momento de grabar esta clase, les dejo el link del video que ellos hicieron para publicar este update del producto: https://www.youtube.com/watch?v=3PhEO41WVLQ

Poner Deepnote en dark mode
En su documentaci贸n oficial mencionan que actualmente no tienen un dark mode desarrollado, pero esperan tenerlo en un futuro cercano. Mientas tanto, recomiendan instalar esta extensi贸n y configurarla con estos valores:

  • Brightness +20
  • Contrast -20
  • Sepia off
  • Greyscale +15

.


Tip adicional: todas tus pesta帽as del navegador se ver谩n as铆, por lo que te recomiendo usar Alt + Shift + D para activar y desactivar el dark mode de tu navegador (te ser谩 muy 煤til en cosas p谩ginas como Deepnote o Drive, pero otras como Platzi, se ven mejor si lo desactivas)


.
El resultado ser谩 algo como esto:

Tipos de datos estad铆sticos

Datos categ贸ricos

Los datos categ贸ricos tambi茅n conocidos como datos cualitativos, representan caracter铆sticas como el g茅nero, el idioma, etc. de una persona. Tambi茅n pueden tomar valores num茅ricos, por ejemplo: 1 para mujeres y 0 para hombres. Hay que tener en cuenta que esos n煤meros no tienen significado matem谩tico.
Los tipos de datos estad铆sticos categ贸ricos se clasifican en:
.

  • Datos nominales: Otros de los tipos de datos estad铆sticos son los que tienen valores nominales que representan unidades discretas y se usan para etiquetar variables que no tienen un valor cuantitativo.
    Estos datos no tienen un orden, aunque cambiara el orden de sus valores, no cambia su significado.

  • Datos ordinales: Los datos ordinales representan unidades discretas y ordenadas. Por lo tanto, es casi lo mismo que los datos nominales, excepto que su orden es importante.
    Las escalas ordinales generalmente, se usan para medir caracter铆sticas no num茅ricas como la felicidad, la satisfacci贸n del cliente, etc.

.

Datos num茅ricos

Estos tipos de datos estad铆sticos tambi茅n se conocen como datos cuantitativos, y se refieren a una medida o recuento. Se clasifican de la siguiente manera:
.

  • Datos discretos: Los datos estad铆sticos son discretos cuando sus valores son distintos y separados. Es decir, cuando los datos s贸lo pueden tomar ciertos valores.
    Este tipo de datos no se puede medir, pero se pueden contar. B谩sicamente representan informaci贸n que se puede clasificar.
  • Datos continuos: Los datos continuos representan mediciones y, por lo tanto, sus valores. no se pueden contar, pero se pueden medir. A su vez, estos se clasifican de la siguiente manera:
    • Datos de intervalo: Los datos de intervalo representan unidades ordenadas que tienen la misma diferencia . Por lo tanto, hablamos de datos de intervalo cuando tenemos una variable que contiene valores num茅ricos que est谩n ordenados y donde conocemos las diferencias exactas entre los valores.

.

El problema con los datos de valores de intervalo es que podemos sumar y restar, pero no podemos multiplicar, dividir o calcular razones. Debido a que no existe un cero verdadero, no se pueden aplicar muchas estad铆sticas descriptivas e inferenciales.
.

  • Datos de relaci贸n: Tambi茅n son unidades ordenadas que tienen la misma diferencia. Los datos de relaci贸n son los mismos que los valores de intervalo, con la diferencia de que tienen un cero absoluto.

Por si no sabias:
JUPYTER. Son unos 鈥渃uadernos鈥 o notebooks, en los que puedes programar por bloques. Como si escribieras un cuaderno. En una porcion, ejecutas una linea sin que tengas que correr todo el programa. Busca ANACONDA
KAGGLE. Es una web que tiene concursos para analistas de datos y programadores, tiene bases de datos de uso libre.
COLAB. Es el Jupyter de Google, es decir no descargas ni instalas nada, lo tienes todo en linea.
DEEPNOTE. Herramienta para crear trabajos en simultaneo con otros colaboradores con los que se pueden hacer cambios en tiempo real en tus lineas de codigo

Amigos les dejo el cheat sheet de ciencia de datos con PANDAS 馃榿

Fun Fact: El Fundador del Proyecto Jupyter es colombiano, paisa.
Se llama Fernando P茅rez, es F铆sico de la Universidad de Antioqu铆a y adem谩s de eso, otro proyecto destacable dentro de la comunidad es IPython

Si quieres moverte mas r谩pido por los bloques de c贸digo, te invito a que revises la paleta de comandos que ofrece Deppnote, puedes acceder con ctrl+p , presionado Esc o dando click al icono de la parte inferior izquierda.

Se te desplegara un menu, es muy parecido a las jupyter notebook pero si tiene un par de diferencias para insertar celdas por debajo o encima. Dejo un peque帽o resumen de los comandos mas utilizados a mi criterio.

  • ctrl + k a帽adir un bloque de c贸digo por encima del bloque actual
  • ctrl + j a帽adir un bloque de codigo por debajo del bloque actual
  • ctrl+enter ejecutar el bloque actual
  • alt + shift + flecha arriba mover un bloque arriba
  • alt + shift + flecha abajo mover un bloque abajo
  • ctrl + shift + D duplicar el bloque

.
vale la pena echarle un ojo 馃槃

Pandas cheat sheets

  • Descarga la version completa en PDF dando click aca
  • Ve a la pagina oficial para conocer mas etalles
    .

A medio curso descubr铆 este maravilloso canal donde te explican todo sobre el preprocesamiento de datos. Por tanto, se facilita tu camino en Deepnote. Descubre el porqu茅 de sus comandos, su variedad y m谩s. Espero te sirva

Valores cualitativos:
Son valores que clasifican o ordenan un dato, ejemplo, color del cabello, sirven para caracterizar o se帽alar pertenencia de un dato.

  • Ordinales: Es para dar una sensacion de orden en ocasiones son numeros, pero pueden ser palabras tambien ejemplo : Malo, Regular, Bueno, Excelente. Van de menor a mayor calidad

  • nominal: Es para clasficar o indicar pertenencia a algo. Ejemplo: Genero, nacionalidad, color de preferencia.

Ojal谩 estas definiciones puedan ayudar a alguien.
.

Datos num茅ricos

脡ste tipo de datos se relacionan con mediciones y pueden operarse matem谩ticamente.
.
Ejemplos: altura, temperatura, n煤mero de habitantes.
.

Datos num茅ricos discretos

Que los datos num茅ricos sean discretos significa que est谩n restringidos de tal forma que entre dos de sus valores posibles no existe una cantidad infinita de otros posibles valores.
.
Usualmente este tipo de datos num茅ricos se asocian a los n煤meros enteros.
.
Ejemplos: a帽os cumplidos, unidades despachadas, horas completas trabajadas.
.

Datos num茅ricos continuos

Que los datos num茅ricos sean continuos significa que entre dos valores cualquiera de 茅stos datos existe una cantidad infinita de otros posibles valores.
.
Usualmente este tipo de datos num茅ricos se asocian al conjunto de los n煤meros reales.

Antes de ver este curso ya usaba pandas. Entender que ahora el dtype de object no es un error sino que nos dice que es una variable categ贸rica 馃槀

  • Tipos de datos

    categoricos:

    ordinal: Cuando existe una relacion de orden entre las categor铆as

    Nominal: cuando no existe esta relacion

    Num茅ricos:

    discreto: ejemplo EDAD (enteros)

    Continuos: Ejemplo altura (decimales)

  • Normalmente cuando pandas categoriza a una variable como objeto significa que no hay n煤meros all铆, es una variable textual

  • Los bol茅anos TRUE o FALSE tambi茅n est谩n en las variables categ贸ricas

  • Las variables num茅ricas esta en int64 (formato por defecto para variables enteras) y float64( formato por defecto para las variables continuas)

Para los que estan tomando esta clase recientemente, para agregar el archivo csv, tienen que desplegar el right side bar, seleccionar project y en Files agregar el archivo.

Cuando intent茅 hacer los siguientes ejercicios, si solo agregaba

df.dtypes

me sal铆a un error porque la variable df no estaba declarada, as铆 que lo hice fue agregar todo de la siguiente forma.

import pandas as pd
df = pd.read_csv('cars.csv')
df.dtypes

espero que esto les ayude

No me qued茅 tan tranquilo con la definici贸n de las subdivisiones de los datos, entonces investigu茅 por ah铆 algo m谩s amplio, les dejo lo que encontr茅 por si a alguien le sirve:

Categ贸ricos. Una variable categ贸rica es una variable con un n煤mero limitado de valores distintos o categor铆as

  • Ordinal. Una variable puede tratarse como nominal cuando sus valores representan categor铆as sin clasificaci贸n intr铆nseca (por ejemplo, el departamento de la empresa en la que trabaja un empleado). Ejemplos de variables nominales incluyen la regi贸n, el c贸digo postal y la afiliaci贸n religiosa.

  • Nominal. Una variable puede ser tratada como ordinal cuando sus valores representan categor铆as con alguna clasificaci贸n intr铆nseca (por ejemplo, niveles de satisfacci贸n de servicio de altamente insatisfecho a altamente satisfecho). Ejemplos de variables ordinales incluyen puntuaciones de actitud que representan grado de satisfacci贸n o confianza y puntuaciones de calificaci贸n de preferencia.

**Num茅ricos. **

  • Discretos. El t茅rmino discreto implica distinto o separado. Por lo tanto, los datos discretos se refieren al tipo de datos cuantitativos que se basan en los recuentos. Contienen solo valores finitos, cuya subdivisi贸n no es posible. Incluye aquellos valores que solo se pueden contar en n煤meros enteros y est谩n separados, lo que significa que los datos no se pueden dividir en fracciones o decimales. Por ejemplo: La cantidad de estudiantes en la escuela, la cantidad de autos en el estacionamiento, la cantidad de computadoras en un laboratorio de computadoras, la cantidad de animales en un zool贸gico, etc鈥

  • Continuos. Los datos continuos se describen como un conjunto de observaciones ininterrumpidas; Eso se puede medir en una escala. Puede tomar cualquier valor num茅rico, dentro de un rango finito o infinito de valor posible. Estad铆sticamente, el rango se refiere a la diferencia entre la observaci贸n m谩s alta y m谩s baja. Los datos continuos se pueden dividir en fracciones y decimales, es decir, se pueden subdividir significativamente en partes m谩s peque帽as de acuerdo con la precisi贸n de la medici贸n. Por ejemplo, edad, altura o peso de una persona, tiempo necesario para completar una tarea, temperatura, tiempo, dinero, etc.

Yo pronunciar铆a en ingl茅s, fon茅ticamente Jupyter como 鈥測煤piter鈥.

Un saludo, mi perfil de Contador me limita con algunas tecnologias, pero aca estoy aprendiendo y motivado, espero me apoyen en algunas preguntas鈥 o aclaraciones. gracias

****Tipos de datos


df.dtypes
#con este comando podemos ver los tipos de datos que tiene mi data frame, las categorias puede ser las siguentes
#obeject: es una variable textual solo textos 
#int64: formato por defecto de pandas para los enteros 
#bool: variables booleanas sin son falas o verdaderas 
#float64: formato con defecto para las variables continuas que serian datos numericos 


#con este comando podemos mirara las columnas de data flame original
#cada columna corresponde a un estadistico, una medida descriptiva
# que romendena a conteo, promedios(mean) desviacion estandar(std), y por ultimo los cuarttiles 
#este el conjunto est谩ndar para medir los data frem

> 

Un aporte con algunos cheat sheets para python
https://www.utc.fr/~jlaforet/Suppl/python-cheatsheets.pdf

Admiro mucho la calma con la que explica el docente y adem谩s la claridad de los conceptos.

Categ贸rico == Datos que tienen categor铆as
Num茅rico == Datos que tienen un valor por su naturaleza

Alimentando la curiosidad, va mi c贸digo de la clase utilizando VSCode e instalando pandas en macOS Big Sur.

import pandas as pd

df = pd.read_csv('a-003-ksm-66.csv')
df = pd.DataFrame(df)
print(df)
print(df.dtypes)

Saludos

Reciban c谩lido saludo
De antemano muchas gracias por el esfuerzo y la calidad de las clases.
recomiendo que tengan un solo entorno / ambiente para desarrollar los talleres鈥 deberia ser homogenea la arquitectura,
es decir. si vamos a estar en deepnote o anaconda o cmder. todos en el mismo entorno. soy data science de ibm - coursera y ellos todo lo tienen en una misma plataforma (anaconda).
todo el set de cursos se basa en la misma plataforma!!
no cambian!!!

Sdos y gracias

gracias

Deepnote es similar al R (R Studio)鈥

Otra forma de interpretar los tipos de datos son los tipos de variables y estas pueden ser: cuantitativas y cualitativas

    • CUALITATIVAS: son las que me indican cualidades, gustos, atributos, etc. Se pueden clasificar en nominales y ordinales.
  1. *Nominales: Son aquellas que me indican atributos, cualidades, etc sin expresar categor铆as superiores e inferiores, ejemplo: El genero, masculino, femenino. M茅todo de pago: cash, debit card, credit card, etc.
  2. Ordinales: Son aquellas que me indican atributos, cualidades, etc de forma jerarquizada, de forma categ贸rica. Por ejemplo: Estrato socioecon贸mico: bajo, medio, alto. Experiencia del usuario: buena, regular, mala. Cargos en una empresa: presidente, vicepresidente, gerente, coordinador, supervisor, etc.
  • CUANTITATIVAS: Son aquellas que se pueden 鈥渃uantificar鈥, que se pueden expresar mediante n煤meros. Por ejemplo, la edad: 15, 20, 50, 67. Altura: 170 cm, 200 cm, etc. Se pueden clasificar como discretas y continuas

Que clase tan buena.

Aunque el proyecto en deepnote esta compartido, recomiendo hacerlo uno mismo

  1. Nos da un conocimiento del deepnote
  2. Ejecutamos las instrucciones, y es prueba y error es la que nos ayuda a aprender.

TIPOS DE DATOS

  1. Categ贸ricos

    • Ordinal
    • Nominal
  2. Num茅ricos

    • Discretos
    • Continuos

there are two categories of data types, the first one is numeric data and the second one is categoric data, the numeric data have two subcategories, discreet data, and continuous data, discreet like the number of children in your family like 3, you can鈥檛 have 2,5 children, and continue as the weather 25.645562 (float). for categorical data, we have two subcategories too, ordinal y nominal, nominal describes a variable that does not have a natural order, and ordinal is one where the order matter but not the difference btw values.

鈿狅笍 today we have more categories for numeric data: ration and interval

5. Tipos de datos

  • Categ贸ricos (g茅nero, categor铆a de pel铆cula, m茅todo de pago)

    • Ordinal
    • Nominal
  • Num茅ricos (edad, altura, temperatura)

    • Discretos
    • Continuos

    Deepnote

Por si alguien quiere correr el archivo cars.csv, a mi me funcion贸 hacieno de 鈥/work/cars.csv鈥

Buena clase.

Comparto los siguientes apuntes de algunos t茅rminos:

**Datos ordinales: **
es un tipo de variable categ贸rica en la que el orden de las categor铆as tiene un significado. Por ejemplo, si tenemos una variable que indica el nivel de estudios de las personas (primaria, secundaria, bachillerato, licenciatura, posgrado), podr铆amos decir que se trata de una variable ordinal, ya que el orden de las categor铆as (primaria, secundaria, bachillerato, licenciatura, posgrado) tiene un significado l贸gico. Es decir, una persona que ha completado la licenciatura tiene un nivel de estudios mayor que alguien que solo ha completado la secundaria. Tambi茅n no podemos asumir que existe una diferencia constante entre las categor铆as. Por ejemplo, no podemos asumir que la diferencia entre el nivel de estudios 鈥渟ecundaria鈥 y 鈥渂achillerato鈥 es la misma que la diferencia entre 鈥渂achillerato鈥 y 鈥渓icenciatura鈥.

Dato n贸minal: un tipo de **dato n贸minal **es un tipo de variable categ贸rica en la que las categor铆as no tienen un orden o jerarqu铆a especial. Por ejemplo, si tenemos una variable que indica el color del cabello de las personas (rubio, moreno, pelirrojo, negro), podr铆amos decir que se trata de una variable n贸minal, ya que no existe un orden l贸gico entre las categor铆as (no podemos decir que el color 鈥渕oreno鈥 sea mayor o menor que el color 鈥渞ubio鈥).
Es importante tener en cuenta que, al tratarse de un tipo de variable categ贸rica, no podemos realizar operaciones matem谩ticas con las categor铆as de una variable n贸minal.

Una unidad discreta es una unidad de medida que solo puede tomar valores discretos, es decir, valores que pueden ser contabilizados y enumerados. Algunos ejemplos de unidades discretas son el n煤mero de personas en una habitaci贸n, el n煤mero de libros en una biblioteca o el n煤mero de unidades vendidas de un producto. Algunos ejemplos de unidades discretas son el n煤mero de personas en una habitaci贸n, el n煤mero de libros en una biblioteca o el n煤mero de unidades vendidas de un producto.

Es importante tener en cuenta que las **unidades discretas **no se pueden usar para medir variables continuas, ya que estas variables pueden tomar cualquier valor dentro de un rango determinado, y no solo valores discretos. Por ejemplo, no podr铆amos medir la altura de las personas usando unidades discretas, ya que la altura puede tomar cualquier valor entre el m铆nimo y el m谩ximo posibles (por ejemplo, 1.50 metros o 2.10 metros). En este caso, necesitar铆amos usar una unidad de medida continua, como los cent铆metros o los metros.

Dato continuo: Un tipo de dato continuo es un tipo de variable que puede tomar cualquier valor dentro de un rango determinado. Por ejemplo, la altura de las personas es una variable continua, ya que puede tomar cualquier valor entre el m铆nimo y el m谩ximo posibles (por ejemplo, 1.50 metros o 2.10 metros).

Es importante tener en cuenta que, al tratarse de una variable continua, podemos realizar todas las operaciones matem谩ticas con los valores de la variable (como sumas, restas, multiplicaciones y divisiones). Adem谩s, podemos usar t茅cnicas estad铆sticas como el promedio, la mediana o la moda para analizar los datos de una variable continua.
Es importante tener en cuenta que, aunque una variable continua puede tomar cualquier valor dentro de un rango determinado, en la pr谩ctica es dif铆cil medir una variable continua con una precisi贸n infinita. Por ejemplo, aunque te贸ricamente podr铆amos medir la altura de las personas con una precisi贸n de decimales, en la pr谩ctica es m谩s com煤n medir la altura en cent铆metros o en metros. Esto se conoce como 鈥渆rror de medici贸n鈥

import pandas as pd
df=pd.read_csv('cars.csv')
df
df.dtypes
df.describe()

Este es un buen recurso donde explican los temas con ejemplos y preguntas https://www.youtube.com/watch?v=Tb3sgUSd2SQ

Tipos de Datos
Entre los datos nos encotramos principalmente con datos de tipo:

  • Categoricos: Son datos que nos dan informaci贸n no num茅rica, pueden ser:
    • Ordinales: Datos que poseen un orden (prelaci贸n) deterninado.
    • Nominal: Datos que no tienen un orden, tienen la misma relaci贸n ger谩rgica
  • Num茅ricos: Son datos que nos dan informaci贸n num茅rica, pueden ser:
    • Discretos: Datos num茅ricos que pueden ser representados con los n煤meros reales
    • Continuos: Datos que poseen un 鈥渟alto鈥, generalmente son n煤meros enteros

Trabajo en c贸digo

  • Usaremos la herramienta deepnote, que permite trabajar con notebooks de python
  • Pandas tiene el m茅todo describe() que nos brinda informaci贸n estadistica de los datos num茅ricos del dataframe df.describe()
  • Para ver el tipo de datos almacenados en un dataframe podemos invocar el atributo dtypes de pandas df.dtypes

Uso practico de estad铆stica descriptiva.

Informaci贸n resumida de esta clase
#EstudiantesDePlatzi

  • Todos los datos existen en 2 categor铆as principales: Los datos categ贸ricos y los datos num茅ricos

  • Categ贸ricos: No son n煤meros y se conocen como categor铆as, pueden ser ordinal o nominal

  • Num茅ricos: Son n煤meros y deben ser tratados de acuerdo a ellos, pueden ser discretos o continuos

  • Cuando tenemos variables discretas significa que son n煤meros enteros y cuando son variables continuas se conocen como float

  • Pandas es conocido como el Excel de Python

  • Aprenderemos a usar DeepNote

  • Podemos enlazar DeepNote con nuestro GitHub

  • Con el comando dtype de la librer铆a de pandas puedo observar que tipos de datos se encuentran dentro de mi DataFrame

  • Cuando pandas me identifica una columna como un objeto, significa que los datos de esta columna no son num茅ricos

  • Con el comando describe obtengo datos estad铆sticos de mi DataFrame, dentro de estos datos puedo encontrar: El conteo, el promedio, el Max y Min y los percentiles 25%, 50% y 75 %

  • Los percentiles 25%, 50% y 75% se conocen como los cuartiles

  • Existen 2 tipos de estad铆sticos descriptivos: Medidas de tendencia centra y medidas de dispersi贸n

  • Las medidas de tendencia central mide el promedio de los datos y las medidas de dispersi贸n me dicen, respecto a esa medida de tendencia central, que tan dispersos est谩n los datos

Para Google Colab:

import pandas as pd
df = pd.read_csv('/content/sample_data/cars.csv')
df
import pandas as pd

df = pd.read_csv(鈥dataset_sample.csv鈥)

df.describe()

Excelente clase y curso.

Excelente curso.

Deepnote es una gran herramienta para a帽adir a nuestro toolbox de data scientist 馃殌馃槑馃鉁

Tipos de datos

Aunque podemos clasificar nuestra informaci贸n de muchas maneras, en estad铆stica descriptiva resulta 煤til claisficarla en dos grandes grupos: datos cuantitativos y datos cualitativos.
.

Datos cuantitativos

Tambi茅n conocidos como datos num茅ricos, son datos extra铆dos de un proceso de medici贸n. A su vez, estos datos se clasifican en:
.

  • Datos cuantitativos continuos: si nuestros valores pueden ser cualquier fracci贸n de nuestra unidad de medida.
  • Datos cuantitativos discretos: si nuestra medici贸n es un conteo simple.

.

Datos cualitativos

Tambi茅n conocidos como datos categ贸ricos, representan propiedades de el objeto de estudio que pueden tomar un n煤mero reducido de valores. Este tipo de datos tambi茅n tiene dos sub categor铆as:
.

  • Datos cualitativos ordinales: si las categor铆as tienen un orden inherente.
  • Datos cualitativos nominales: si no hay un orden obvio para las categor铆as.

No es tan amigable. Es mejor colab para iniciar

HELP, el video se corta/traba en 12:13

wow, que clase tan clara!

Muy buen inicio, tener muy claras las bases de los cursos anteriores a este

Datos categ贸ricos: tambien llamados cualitativos son los que definen categorias, o caracteristicas no medibles, tambien pueden distiguirse porque no se pueden hacer operaciones algebraicas con estos:

  • Ordinal: Son aquellos donde el orden es representativo por ejemplo: Los niveles escolares, la etapa de una enfermedad, los lugares de una carrera, el grado militar, es decir todos aquellos datos donde el orden represente relevancia.

  • Nominales: Son todos aquellos datos donde el orden no es tan representativo, por ejemplo, el sexo, las clases sociales de una poblacion, el color del cabello, la raza de perritos, marcas de tenis鈥

Datos num茅ricos: Tambien se les llaman datos cuantitativos, son todos aquellos que podemos contar o definir numericamente.

  • Discretos: Son aquellos que podemos definir con numeros enteros naturales, por ejemplo la cantidad de autos q se fabrican digamos en un mes, cantidad de productos vendidos, cantidad de arboles cortados, numero de amigos o parejas sentimentales, votos por casilla鈥

  • Continuos: son todos aquellos datos que estan definidos en la recta real, por jemplo, el peso, la altura, el tiempo q tarda una persona ejercitandoes, los litros de agua gastados en tu casa, el consumo de el茅ctricidad en una fabrica, la distancia de los lineas de tensi贸n鈥

PERO MUESTRALO COMO HACER NO ME FOTOS

TIPOS DE DATOS:

Categ贸ricos:

  • Ordinal: Existe una jerarquita o relaci贸n de orden en las categor铆as
  • Nominal: No existe una jerarquita en las categor铆as

Num茅ricos:

  • Discretos: Entero, ej: La edad
  • Continuos: Decimal ej: La altura

Si quieren aprender mas sobre los entornos de trabajo como deepnote o google colab. Pueden revisar este curso

Maravillosa clase. Para seguir estudiando estad铆sticas.

Tenemos 2 tipos de datos:

  1. Categ贸ricos (g茅nero, categor铆a de pel铆cula, m茅todo de pago) -> ordinal y nominal
  2. Num茅ricos (edad, altura, temperatura) -> discretos y continuos

A la librer铆a Pandas se le conoce tambi茅n como 鈥淓l excel de Python鈥

Es genial la herramienta Deepnote

Deepnote es sencillamente maravilloso! Dificil volver al editor de codigo luego de conocerlo. 馃槂

Deepnote es demasiado bonito y facil de usar. Me gusta.

Qu茅 bonito es Deepnote, sin duda alguna, mi nueva herramienta favorita.

Espero muchos m谩s cursos con este profesor, explica todo con mucha claridad.

Hola,

Les comparto un art铆culo donde se describe la diferencia entre tipo de variables discretas y continuas. Aqu铆

Saludos!

Hola!
El curso claramente esta centrado en estad铆stica descriptiva, sin embargo, les quiero compartir algunas cosas que aprend铆 del Curso de Manipulaci贸n y An谩lisis de Datos con Pandas y Python (ac谩 la liga: https://tuit.es/gk31v). Si tu camino es la ciencia de datos y aunque no lo sea, te recomiendo much铆simo ese curso.

  1. Se puede generar una variable que almacene el path de donde estaremos tomando los archivos que estaremos revisando con ayuda de pandas y, con respecto a ese path y apoyados con la funci贸n format, podemos pasar el nombre del archivo que usaremos para cargar la variable de dataframe. Esto aplica en casos en donde los archivos tienen una ruta diferente al home de ejecuci贸n de nuestro programa/notebook

  2. El profe Pacho uso la funci贸n dtypes para obtener las caracter铆sticas de los campos dentro del dataframe, podemos de igual forma hacer uso de la funci贸n info()

  3. El uso de describe realiza un filtro en donde s贸lo considera a los campos cuyo tipo de dato es num茅rico. Aquellos que forman parte de los datos categ贸ricos (que aparecen en el listado como tipo object y bool), no est谩n considerados dentro de las operaciones de describe. Podemos agregarlos, usando la funci贸n describe como >> describe(include = 鈥榓ll鈥), sin embargo, como no contienen valores con los cuales podamos realizar las operaciones matem谩ticas, nos retornara un valor nulo. Hay forma de que estos datos tomen sentido a las operaciones, ya que un dato categ贸rico podr铆a verse desde la perspectiva de base de datos como un valor de cat谩logo y, con ello, podemos realizar funciones de agrupaci贸n, por ejemplo, sin embargo, es posible que estos temas no formen parte del foco central de este curso y de ah铆 mi recomendaci贸n para profundizar en ello 馃槂

from icecream import ic
import pandas as pd

dir_pandas = './files/{}'

def run():
    df = pd.read_csv(dir_pandas.format('cars.csv'))
    ic(df.info())
    ic(df.dtypes)
    ic(df.describe())


if __name__ == '__main__':
    run()

Hey team, there鈥檚 my deepnote for the notes
Link

Por si la diferencia entre datos nominales y ordinales no qued贸 muy clara:

  • Nominales: No pueden ser ordenados. Por ejemplo: nombres, marcas, colores鈥
  • Ordinales: Consisten de grupos o categor铆as que siguen un orden estricto. Por ejemplo, escalas como:
    • de feo a delicioso
    • no me gusta - casi no me gusta - neutral - me gusta un poco - me gusta
    • nunca - casi nunca - ocasionalmente - casi siempre - siempre

Tipos de datos, ojo hay mas, pero estos son los principales

https://pandas.pydata.org/docs/user_guide/index.html
Documentaci贸n de Pandas, va a ser muy 煤til para manipular datos.