Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Metáfora de Bill Gates en un bar

7/25
Recursos

Nota:
En el min 11:05 y 14:11 el profesor en realidad hace referencia a la mediana.

Aportes 35

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Es bueno que nos vayamos familiarizando con la simbología de la media muestral y poblacional

Hola compañeros, les comparto mis apuntes de las formulas
.
La formula de la media es:

La formula de la mediana cuando n es par:

La formula de la mediana cuando n es impar:

Probablemente lo veremos más adelante, pero medidas como la desviación estándar nos ayudan a conocer si debemos confiar en la media o recurrir a la mediana.

La metáfora de Bill Gates representa cómo los Gobiernos nos dicen qué “hay menos pobres” o que ahora “los pobres ganan más”.
El mismo truco que aplican con las elecciones.

No conocía dicha metáfora. A partir del próximo año cuando enseñe en estadística medidas de tendencia central se las comentaré… 😄

Una de las razones en por que la mediana funciona como buen forma de calcular el valor promedio de unos datos, es por que la mayoria de los valores por lo general siempre se encuentren o se concentran en el centro de los datos.

Además la mediana es el valor que está “geometricamente” en el centro de los datos, por eso en muchas ocasiones se prefiere usar la mediana en lugar de la media aritmetica por que es una mejor aproximacion en donde se encuentran la mayoria de nuestros datos sin considerar su valor como lo hace la media aritmetica que es muy susceptible a darnos valores que no son representativos de los datos.

"Si por otro lado lo que hacemos es calcular LA MEDIANA".

Código sencillo para calcular media en Python:

import random

def calculate_mean(numbers):
    return sum(numbers) / len(numbers)


random_numbers = [random.randint(1, 100) for _ in range(100)]

print(f'La media de {random_numbers} es {calculate_mean(random_numbers)}')

Código sencillo para calcular mediana en Python:

import random

random_numbers = [random.randint(1, 100) for _ in range(100)]

def calcula_mediana(valores):
    valores.sort()
    if len(valores) % 2 == 0:
        return (valores[len(valores) // 2] + valores[len(valores) // 2 - 1]) / 2
    else:
        return valores[len(valores) // 2]

print(f'La mediana de {sorted(random_numbers)} es {calcula_mediana(random_numbers)}')

Es muy cierto lo que dice el profe, por eso se utiliza en medición del ingreso la curva de Lorentz o el coeficiente Gini. De otra parte en estadística siempre se procura tener la mayor cantidad de observaciones disponibles si no se cae en algo denominado micronumerosidad, por eso el muestreo siempre esta sujeto a grados de confianza, en el ejemplo del bar se tendría un grado de confiabilidad supremamente bajo.

"Por otro lado, LA MEDIANA". Hay un pequeño error allí, pues se refiere a la mediana pero le dice media.

Definiciónes

Media aritmética (promedio)

Dados los n números la media aritmética se define como:

Por ejemplo, la media aritmética de 8, 5 y -1 es igual a:

Mediana

Resumen de la metafora de BIll Gates:

  • Esta metáfora nos muestra que al tener valores atípicos nuestra media se vera sesgada o desviada.

  • La mediana será un mejor valor para manejar un conjunto de datos con valores atípicos.

  • Por esto hablar del ingreso per cápita de un país es equivocado cuando hay una distribución de riqueza desigual.

existe una manera de medir la calidad de la media (promedio) o medir que tan sesgado es este estadistico, me adelanto un poquito con las medidas de dispersión pero esto me parece que tambien es clave para la estadistica se llama coeficiente de variación :

formula para calcular el coeficiente de variación

(desviación estándar) / (promedio) * 100 = coeficiente

Si el coeficiente es mayor al 25% entonces los datos no son homogéneos varían mucho y no es confiable el promedio.

Si bien ya estaba familiarizado con los términos media, mediana y moda, debo admitir que fue muuuy interesante la clase.

Un aporte, los conjuntos no solo pueden estar ordenados de mayor a menor. Tmb pueden estarlo de menor a mayor y nada cambia para calcular la mediana. Lo importante es que estén ordenadas.

La analogía utilizada del caso Bill Gattes es tan genial para comunicar que los valores atípicos en un gran conjunto de datos tiende a ser un factor clave al momento de extraer conclusiones mas acertadas, seguramente más adelante veremos que hay otras medidas que nos pueden apoyar en estos análisis, pero es grandioso tener a comunicadores como el Profesor Francisco Camacho que muestra los principios básicos de estadística.

Muy buen ejemplo, siempre debemos fijarnos que no hayan Bill Gates en nuestros datos jaja

Excelente explicación, un simple dato puede generar sesgo.

Mediana & Media pueden sesgar los resultados con un valor atipico que nos cambia el resultado de la operación.
Me encanto el ejemplo de Bill Gates en un bar.

Media la conocemos en el Río de la Plata como “Promedio”

Como lo veo, para este ejemplo, las dos medidas no pueden representar de manera fiel el fenómeno. Propongo dos soluciones:
Primera. Quitar el dato atípico de la base de datos.
Segundo. Utilizar la media ponderada y darle un peso % (w) a Bill.
Así se puede quitar la distorsión que genera este valor atípico.

Cuando hay valores atípicos el promedio podría perder una aproximación realista.

La mediana es una fórmula más adecuada para evitar sesgos.

Excelente explicación.

Para escribir formulas en Jupyter Nootbooks pueden usar Latex que sirve para escribir sobre Markdonw!

Buenas [email protected]!!
Les dejo mis apuntes 💪

Me gusta como el Profesor Francisco, en sus cursos, hace ver bien pro las fórmulas con la notación matemática que les da. jaja 😃

mejor vendo avon

Yo pense que el indice en las notaciones cientificas, cuando se fuese a recorrer un set de datos (como arreglo por ejemplo) lo hacian igual que los programadores, iniciando en cero, ya que la estrutura del computo asi lo exige. Me causa curiosidad porque mayoritariamente los que recrearon estas formulas en la computacion, pues eran medianamente, matematicos.

la formula funciona porque se le da un valor mas a la longitud del conjunto y se corta por la mitad quedando el punto donde termina la primera mitad como mediana del conjunto inicial sin la suma

BUena metafora la de Bill gates

La media y la mediana desempeñan una función semejante para comprender la tendencia central de un conjunto de números. La media ha sido tradicionalmente una métrica popular de un punto medio en un conjunto; sin embargo, tiene la desventaja de ser influida por valores separados que son mucho más altos o bajos que el resto de los valores. Por esa razón, la mediana es una métrica de punto medio mejor para los casos en los que un número pequeño de valores atípicos podrían sesgar drásticamente la media.

Por otro lado, la mediana ( median(x) ). Un pequeño error en la exposición. 💪

Muy buenas clase y aportes de los compañeros.

Buena analogía para entender perfectamente cómo decidir cual estadístico usar para la toma acertiva de las decisiones.