Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Distribución Normal

15/24
Recursos

Aportes 143

Preguntas 4

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Nota de cornell de la clase:

En mi última relación de pareja, utilizaba la estadística y la probabilidad para determinar los posibles días de discusiones o problemas ocn mi exnovia. Tenía la regla de que de 300 días habíamos discutido en el 5 por ciento de los mismos, es decir 15 días. Esto significaba que en 3 meses tendríamos al menos 4 días y medio de discusiones. Al mes 1 día y medio de discusión.

Y sí, hubo un tiempo en el que fue así, una distribución normal con un intervalo de confianza del 95%. Solo hasta los últimos 6 meses, cuando todo se fue al carajo jajajajaja terminamos por diferencias en nuestros futuros profesionales. De hecho, su influencia en mi vida me llevo a estar en Platzi ahora. Fue una muy buena relación 😄

Modifiqué el código para graficar la distribución normal del ejemplo que hemos venido trabajando.

from bokeh.plotting import figure, show
import random
import math

def media(X):
    return sum(X) / len(X)


def varianza(X):
    mu = media(X)

    acumulador = 0
    for x in X:
        acumulador += (x - mu)**2

    return acumulador / len(X)


def desviacion_estandar(X):
    return math.sqrt(varianza(X))

def distribucion_normal(X,mu,sigma):
    valores_y = []
    for x in X:
        y = (1/(sigma*math.sqrt(2*math.pi)))*math.exp(-1/2*((x-mu)/(sigma))**2)
        valores_y.append(y)
    return valores_y

def graficar(X,valores_y,media,sigma):
    
    grafica = figure(title=f'Distribución normal', x_axis_label='x', y_axis_label='y')
    
    grafica.line(X, valores_y, legend=f'Distribución normal',line_color='blue')

    media_y = [min(valores_y),max(valores_y)]
    media_x = [media,media]

    grafica.line(media_x, media_y, legend=f'Media',line_color='red')

    desviacion_estandar_1_y = [min(valores_y),max(valores_y)]
    desviacion_estandar_1_x = [media+sigma,media+sigma]

    grafica.line(desviacion_estandar_1_x, desviacion_estandar_1_y, legend=f'Desviación estándar',line_color='green')

    desviacion_estandar_2_y = [min(valores_y),max(valores_y)]
    desviacion_estandar_2_x = [media-sigma,media-sigma]

    grafica.line(desviacion_estandar_2_x, desviacion_estandar_2_y,line_color='green')

    show(grafica)

if __name__ == '__main__':

    X = sorted([random.randint(0, 100) for i in range(100)])
    mu = media(X)
    Var = varianza(X)
    sigma = desviacion_estandar(X)

    valores_y = distribucion_normal(X,mu,sigma)
    graficar(X,valores_y,mu,sigma)

    print(f'Arreglo X: {X}')
    print(f'Media = {mu}')
    print(f'Varianza = {Var}')
    print(f'Desviacion estandar = {sigma}')```

El coeficiente intelectual de una población es una distribución normal. 😮

Vaya, David Aroesti utiliza ejemplos bastante interesantes de física. Me sorprende lo bien informado que está, no es muy común entre programadores e ingenieros. Creo que él hubiera sido buen físico y profe de física. 😄

https://github.com/karlbehrensg/programacion-dinamica-y-estocastica
Distribución Normal

La distribución normal es una de las distribuciones mas recurrentes en cualquier ámbito. Se define completamente por su media y su desviación estándar. Permite calcular intervalos de confianza con la regla empírica.

Regla empírica

También conocida como la regla 68-95-99.7. Señala cuál es la dispersión de los datos en una distribución normal a uno, dos y tres sigmas.

Permite calcular probabilidades con la densidad de la distribución normal.

uy, tuve dos cursos de estadística y me tocó ver esa vaina hasta en la sopa

Soy medico y en todos los estudios que la gente se hace (de azúcar para conocer su control de diabetes, de presión arterial para conocer el estado de hipertensión, etc), usamos desviaciones estándar.

Entonces los valores normales de glucosa, que son de 70 a 100, por ejemplo, son resultado de que mundialmente se tomó la glucosa a personas sanas y se estableció que la “normalidad” estadística de azúcar en sangre se encontraba entre estos valores.

Lo que esté por encima o por debajo de ese rango, no coincide con lo encontrado en personas sanas y por lo tanto debe estudiarse qué es lo que está causando esta anormalidad (enfermedad).

De hecho algunas enfermedades (como la baja tasa de crecimiento en niños, o sea, el que un niño se esté quedando pequeño en cuanto a su altura con respecto a sus compañeros o amiguitos de su edad), se cuantifican y tratan según el número de desviaciones estándar que está por encima o por debajo de la media de niños en México (o en según qué población) a la edad del pequeño. 😄

Recomiendo ampliamente, para una introducción sólida al tema, el siguiente sitio:
Normal Distribution
La explicación es accesible y muy clara.

Dejo un video para ampliar información

https://www.youtube.com/watch?v=T7_ktqfVseU

Ejemplo: Calcularla cantidad de alumnos en platzi que terminan un curso, y determiar la desviacion estandar segun a sus edades

En el trading podemos ver la distribución normal en la cantidad de operaciones que se realizan en un determinado periodo y determinar mediante la desviación estadar el numero de vendedores vs numero de compradores

Actualmente se encuentra que la curva de contagio de Covid 19 (coronavirus) obedece a uns distribución normal y también se menciona que dicha distribución es aplicable a la investigación del gusto de los usuarios/consumidores sobre los objetos artesanales y de diseño Para profundizar, leer el siguiente artículo de abril de 2020:

https://www.researchgate.net/publication/341016287_Modelo_matematico_del_COVID-19_aplicacion_a_la_investigacion_en_diseno_XI_Congreso_Latinoamericano_de_Ensenanza_del_Diseno_Universidad_de_Palermo_UP_RA

Al analizar datos e intentar modelos de regresión generalmente se tiene dentro de las hipótesis, que los errores son iid(0, sigma^2) con distribución normal. Obviamente se debe tratar de analizar si esta hipotesis es correcta, haciendo graficos qqplot, histogramas , ver si hay multicolinealidad ,…etc.

La distribución normal se podría observar si estamos revisando la cantidad de personas que visitan cierta aplicación en un horario determinado del día.

medir la intención de voto en la población

creo que cuando se describió el bozon de hiig

En manufactura se manejan grados seis sigma

En las alturas y diámetros de los árboles con una misma edad

La mecánica de los gases de Maxwell
Fue la obra del astrónomo Quetelet (más abajo) quien puso a James Clerk Maxwell (1831-1879) en el camino de la mecánica estadística: las moleculas de un gas son como los individuos de una población, ya que el desorden a escala individual se transforma en orden a escala poblacional.

La curva de Maxwell indica cuántas partículas de gas se mueven a una velocidad determinada y se eleva suavemente desde velocidades bajas, alcanza el pico en la media, y vuelve a descender suavemente hacia las velocidades altas. Esta distribución muestra que la mayoría de las partículas se mueven a una velocidad alrededor del promedio.

![](

En las encuestas que dicen si GNU/Linux gana o pierde terreno en el sector de computadoras de escritorio :b

Facturas de venta de una empresa de un determinado periodo.

El resultado de los examenes

En mecánica cuántica everywhere.

Xd curiosidad morbosa chavos:
Saben que no solo aplica en esto que dijo David, sino que tambien sirve en la confiabilidad y aceptacion de datos en sistemas de control de calidad

Algunos test de “inteligencia”

Mientras más pequeña es la desviación estándar, la gaussiana es más picuda.

En mis clases tanto de estadistica inferencial, administración de proyectos y en la clase de control de estadistico de la calidad siempre usabamos la distribucion normal, era el pan de cada dia, y uno de los ejemplos que se vienen a mi mente es cuando por ejemplo una empresa que fabrica tubos quiere que una linea de produccion en particular produzca tubos de 5.5 metros de largo. entonces supongamos que al día producen 50 tuvos y miden cada uno y resulta que le media está en 5.5 (por ejemplo) con una desviación de 0.8 cm. digamos que la empresa acepta un margen de error 1 cm, eso quiere decir que la empresa acepta tubos que estan entre 5.49 metros y 5.51 metros. si la desviacion fue de 0.8 cm eso quiere decir que con seguridad el 68% de los tubos serán aceptados ya que 1 sigma (0.8 cm) es casi el mismo valor del margen de error que acepta la empresa.
entonces sabiendo eso uno puede saber que en la empresa hay muchos desperdicios y tambien puede saber que quizá en el proceso de fabricación haya problemas y por eso aproximadamente el 32% de los tubos salen defectuosos. (suponiendo que llamamos defectuosos a los tubos que tienen mas 1cm de margen de error).
este es un ejemplo de situaciones en las que se nos presentan distribuciones normales.

En encuestas, proceso de calidad de productos.

señales de comunicación

Las propiedades mecanicas de un material como fluencia y ruptura siguen una distribucion normal lo cual es muy importante en toda el area de la ingenieria mecanica y civil.

Las calificaciones de una escuela se pueden acercar a una distribución normal.
También cosas como la altura de una población.

En las edades de los estudiantes de Platzi.

Las calificaciones a final de semestre, lol

Les comparto un vídeo muy interesante de Javier Santaolalla en la que habla del criterio de significación de 5 sigmas, empleado para determinar si una observación es considerado un descubrimiento en la Física de Partículas
https://www.youtube.com/watch?v=iM1W_9ScCzs

El tema de distribución normal lo escuché muchas veces en las predicciones del clima, las encuestas electorales, anuncios de huracanes

la distribución normal la podemos ver en rangos salariales de un grupo o población o en los rangos de edad de una institución.

En astronomía, para determinar la velocidad de las galaxias, se usan varias distribuciones normales, donde cada una de las distribuciones se mezclan. Sobre estos estudios se concluyeron que solo el 20% de la materia gravitatoriamente activa es visible. El 80% restante es lo que se llama materia obscura.

En maquila es my común el uso de la distribución estándar para medir y controlar la calidad de lo que fabrican.

En esencia buscan disminuir la desviación estándar ya que esto garantiza que el 97.7777% de la producción este dentro de los parámetros de calidad.

Nota referente a la notación

Existen dos tipos de estadística, la descriptiva la la inferencial. En la primera se conoce toda la población y en la segunda solo una parte que le llamamos muestra.

  • La desviación estándar para estadística descriptiva se denota por $\sigma$ mientras que en inferencial se usa $s$.

  • El promedio en estadística descriptiva se denota por $\mu$ mientras que en inferencial solo se le coloca una ralla arriba del conjunto $\bar{x}$.

Pensemos en la estatura de todas las mujeres españolas; dicha altura sigue una distribución normal. Es decir, la estatura de la mayoría de mujeres estará cerca de la estatura media. En este caso, la altura media española es de 163 centímetros en las mujeres.

Por otro lado, un número similar de mujeres serán un poco más altas y un poco más bajas que 163cm; sólo unas pocas serán mucho más altas o mucho más bajas.

Existiría una distribución normal entre la altura de todas las personas mayores a 20 por ejemplo?

Hay que incorporar el coeficiente de variación al algoritmo de las estadísticas descriptivas. es simplemente dividir la desviación estándar sobre la media.

Comparto un video donde explican qué es la distribución normal

https://www.youtube.com/watch?v=phY8Z9-TXCY&ab_channel=Píldorasmatemáticas

Las computadoras cuánticas, son el futuro viejo.

Con los grados de confianza, tenemos nuestra modernidad.

La distribución normal, se basa en que en una desviación estándar se encuentran el 68% de los datos, luego en dos deviaciones estándar, se encuentran ya el 95% de los datos y en un 97.7% son 3 sigmas. Lo que casi que completa la totalidad de los datos.

Permite calcular probabilidades con la densidad de la distribución normal.

La regla empírica, nos dice cómo van destribuidos los datos: 68 - 95 - 99.7 que nos señala cuál es la disperción de los datos en una distribución normal a uno, dos y tres sigmas.

Cuándo realizamos inversiones, es inteligente y común, chequear la media del retorno a la inversión, para ver que sea estable.

Entre menos varíe la desviación estándar, tenemos una presición más grande osea que la disperción de los datos, es menor, osea que todo parece estar en un mismo sitio.

Las distribuciones normales, tienen una peculiar simetría con respecto de la media.

La distribución normal, la podemos definir por su definición estándar y su media

Incluso puedes convertir distribuciones en Normales, a través del teorema del límite central.

Podemos ver una distribución normal, en casi todos los conjuntos de variables.

La distribución normal, es la distribución más común y recurrentes en el mundo de la estadística.

El otro d freddy puso una distrubucion normal en un platzi live para referirse a que tipo de desarrolladores son los que pueden estar a salvo tras la llegada de github copilot

Creo que puede existir una distribución normal en las edades de las personas en una ciudad determinada.

En este apartado puedes encontrar lo siguiente:

  • ¿En qué me ayuda la distribución normal?

La distribución normal la encuentras en algunas de estas variables:

  • notas de un examen
  • Tamaño de una persona en una población específica

A continuación les dejo el código para graficar en Colab el ejercicio de Media, Varianza, Y Distribución Normal. La ventaja de hacer en la nube de Google es que no se necesita configurar un ambiente local de trabajo.

PDTA: Utilicé parte del compañero Camilo Quiceno

import matplotlib.pyplot as plt
import random
import math

#Método que permite obtener la media
def media(X):
    return sum(X) / len(X)

#Método que permite calcular la varianza
def varianza(X):
    mu = media(X)
    acumulador = 0
    for x in X:
        acumulador += (x - mu)**2

    return acumulador / len(X)
#Método que permite calcular la desviación estándar
def desviacion_estandar(X):
    return math.sqrt(varianza(X))

#Método para obtener la distribución normal
def distribucion_normal(X,mu,sigma):
    valores_y = []
    for x in X:
        y = (1/(sigma*math.sqrt(2*math.pi)))*math.exp(-1/2*((x-mu)/(sigma))**2)
        valores_y.append(y)
    return valores_y

#Método para graricar los métodos anteriores
def graficar(X,valores_y,media,sigma):
    #Media
    media_y = [min(valores_y),max(valores_y)]
    media_x = [media,media]
    #Desviación Estándar
    desviacion_estandar_1_y = [min(valores_y),max(valores_y)]
    desviacion_estandar_1_x = [media+sigma,media+sigma]
    #
    desviacion_estandar_2_y = [min(valores_y),max(valores_y)]
    desviacion_estandar_2_x = [media-sigma,media-sigma]
 
    plt.plot(media_x,media_y,linewidth=2, color='b', label='Media')
    plt.plot(X,valores_y,linewidth=2, color='r', label='Distribución normal')
    plt.plot(desviacion_estandar_1_x,desviacion_estandar_1_y,linewidth=2, color='g',  label='Desviación estándar')
    plt.plot(desviacion_estandar_2_x,desviacion_estandar_2_y,linewidth=2, color='g')
    plt.xlabel('x')
    plt.ylabel('y')
    plt.title('Distribución normal')
    plt.grid()
    plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.)
    plt.show()

if __name__ == "__main__":
    
    X = sorted([random.randint(0, 100) for i in range(100)])
    mu = media(X)
    Var = varianza(X)
    sigma = desviacion_estandar(X)

    valores_y = distribucion_normal(X,mu,sigma)
    graficar(X,valores_y,mu,sigma)

    print(f'Arreglo X: {X}')
    print(f'Media = {mu}')
    print(f'Varianza = {Var}')
    print(f'Desviacion estandar = {sigma}')```


en optimización de procesos y en arboles de decisión

Hola amigos,

Para consolidar lo aprendido en esta clase, recomiendo mucho el siguiente enlace:
https://es.khanacademy.org/math/ap-statistics/density-curves-normal-distribution-ap/stats-normal-distributions/v/ck12-org-normal-distribution-problems-empirical-rule

¡Éxitos! 😃

Hola a todos, en este vídeo de Khan Academy pueden entender la fórmula de la Distribución Normal y cómo funciona.
.
Esta muy bueno, se los recomiendo 😃
https://www.youtube.com/watch?v=hgtMWR3TFnY

Esto si es raro . De distribuciones discretas se paso a distribuciones continuas . Supongo que para alguien nuevo en esto si se sentirá confundido pero animo a que no se rinda .

La distribución normal es una de las distribuciones mas recurrentes en cualquier ámbito de nuestra realidad( distribuciones de edades, lenguajes de programación, altura de personas en una poblacion, etc.)
Se define completamente por su media y su desviación estándar.

Media de la cantidad de horas dedicadas a un proyecto

Es curioso que cuando mides errores de experimento a veces te encuentres con distribuciones normales . Aun no logro explicar por que sucede eso .

La edad de inicio de consumo de alcohol en la población, en el índice de masa corporal, el número de cigarrillos que fuma alguien, la edad de inicio de vida sexual activa, etc.

que bien explicado

“The media playback was aborted due to a corruption problem or because the media used features your browser did not support”
😦

En las calificaciones de un grupo de estudiantes, o de los exámenes estatales.

En determinaciones de analitos por ICP, tanto de masas como de gas, se usa bastante para la normalización y estandarizacion de los metodos de analsis, junto con el uso de la prueba T, modelos de regresion, analisis residuales y propagación de errores (incertidumbres) podia llegar a revisar todos los factores de errores en la tecnica empleada, tanto aquellos sistematicos como los aleatorios.

Aprendí más de distribuciones normales en 8 minutos de clase con David, que en 4 horas de módulo en la universidad, jejejeje

Calificaciones de un examen

Distribución normal: En los resultados de los examenes universitarios. Acá en Colombia llamados Saber Pro.

Creo que una distribución normal seria el indice de obesidad en una población.

Podría encontrase en el campo de Visión computarizada al analizar con que probabilidad una imagen observada corresponde a un objeto.

También se conoce como la campana de Gauss.
Este artículo tiene más info… http://www.matematicasdigitales.com/la-herramienta-que-todos-quieren-la-campana-de-gauss/

alguien sabe como debo usar el teclado para escribir mas rápido ??

Interesante clase!

jajajjaj Levanto una piedra y encuentro una distribución normal!!! jajajaja muy bueno

La distribución normal se puede encontrar en las encuestas que nos realizan en los censos de la población.

¿Qué significa el eje de las y en las gráficas? o por qué la gráfica de la izquierda es más alta

En los salarios de los programadores

¡Ignoraba lo de las 5 desviaciones estándar en la física de partículas!
😮

Este concepto también es usado en la estrategia de mejora de procesos Six Sigma, donde se busca reducir la variabilidad y obtener prácticamente cero fallas en los lotes de producción.

buena explicacion

Uso del tiempo en un día.

Encuestas del DANE, aplican distribución normal

Es la primera vez que veo el término de “Distribución Normal”. O a lo mejor no lo recuerdo, pero lo que tengo de memoria es nuevo para mí.

Mi estado de cuenta segun los dias del mes.

Definición Distribución normal.

La estatura de los estudiantes de Platzi

La distribución normal se basa en el principio de:

Los 2 extremos de la grafica tendrán un comportamiento similar.

De acuerdo a lo anterior, tenemos los siguientes ejemplos:

La altura de las personas, habrá pocas personas que tengan una estatura baja, asi como habrá personas que tengan una estatura alta

Dato adicional:
Para calcular el porcentaje de los elementos menores a X, bastará con integrar la función con un dominio máximo de X

una ejemplo conocido es la mecánica de los gases de Maxwell:

Dado esto que aprendí hoy, la Distribución Normal se ve en los escrutinios de las elecciones de mi país (Uruguay); y es lógico que así sea, en Uruguay el sufragio es obligatorio, por lo que la población empadronada que vota oscila entre el 94-98%.
También se utiliza al medir el salario real y la media salarial.

En la evaluación del valor presente neto de proyectos complejos, en ambientes de alta incertidumbre. También en la valoración de minas y campos petroleros. Ahora con la distribución de la tasa de contagios del Covid-19 en un país o zona determinada.

en el analisis tecnico de un activo financiero, utlizamos una distribucion normal para evaluar precio vs tiempo