Nota de cornell de la clase:
Introducción
Objetivos del Curso
Programación Dinámica
Introducción a la Programación Dinámica
Optimización de Fibonacci
Caminos Aleatorios
¿Qué son los caminos aleatorios?
Entendiendo la aleatoriedad con Python
Camino de Borrachos
Desarrollando la simulación
Visualización de Caminos Aleatorios
Programas Estocásticos
Introducción a la Programación Estocástica
Cálculo de Probabilidades
Simulación de Probabilidades
Inferencia Estadística
Media
Varianza y Desviación Estándar
Distribución Normal
Simulaciones de Montecarlo
¿Qué son las Simulaciones de Montecarlo?
Simulación de Barajas
Cálculo de PI
Implementación del Cálculo de PI
Muestreo e Intervalos de Confianza
Muestreo
Teorema del Límite Central
Datos Experimentales
¿Cómo trabajar con datos experimentales?
Regresión Lineal
Conclusiones
Conclusiones
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
David Aroesti
Aportes 157
Preguntas 4
Nota de cornell de la clase:
En mi última relación de pareja, utilizaba la estadística y la probabilidad para determinar los posibles días de discusiones o problemas ocn mi exnovia. Tenía la regla de que de 300 días habíamos discutido en el 5 por ciento de los mismos, es decir 15 días. Esto significaba que en 3 meses tendríamos al menos 4 días y medio de discusiones. Al mes 1 día y medio de discusión.
Y sí, hubo un tiempo en el que fue así, una distribución normal con un intervalo de confianza del 95%. Solo hasta los últimos 6 meses, cuando todo se fue al carajo jajajajaja terminamos por diferencias en nuestros futuros profesionales. De hecho, su influencia en mi vida me llevo a estar en Platzi ahora. Fue una muy buena relación 😄
Modifiqué el código para graficar la distribución normal del ejemplo que hemos venido trabajando.
from bokeh.plotting import figure, show
import random
import math
def media(X):
return sum(X) / len(X)
def varianza(X):
mu = media(X)
acumulador = 0
for x in X:
acumulador += (x - mu)**2
return acumulador / len(X)
def desviacion_estandar(X):
return math.sqrt(varianza(X))
def distribucion_normal(X,mu,sigma):
valores_y = []
for x in X:
y = (1/(sigma*math.sqrt(2*math.pi)))*math.exp(-1/2*((x-mu)/(sigma))**2)
valores_y.append(y)
return valores_y
def graficar(X,valores_y,media,sigma):
grafica = figure(title=f'Distribución normal', x_axis_label='x', y_axis_label='y')
grafica.line(X, valores_y, legend=f'Distribución normal',line_color='blue')
media_y = [min(valores_y),max(valores_y)]
media_x = [media,media]
grafica.line(media_x, media_y, legend=f'Media',line_color='red')
desviacion_estandar_1_y = [min(valores_y),max(valores_y)]
desviacion_estandar_1_x = [media+sigma,media+sigma]
grafica.line(desviacion_estandar_1_x, desviacion_estandar_1_y, legend=f'Desviación estándar',line_color='green')
desviacion_estandar_2_y = [min(valores_y),max(valores_y)]
desviacion_estandar_2_x = [media-sigma,media-sigma]
grafica.line(desviacion_estandar_2_x, desviacion_estandar_2_y,line_color='green')
show(grafica)
if __name__ == '__main__':
X = sorted([random.randint(0, 100) for i in range(100)])
mu = media(X)
Var = varianza(X)
sigma = desviacion_estandar(X)
valores_y = distribucion_normal(X,mu,sigma)
graficar(X,valores_y,mu,sigma)
print(f'Arreglo X: {X}')
print(f'Media = {mu}')
print(f'Varianza = {Var}')
print(f'Desviacion estandar = {sigma}')```
El coeficiente intelectual de una población es una distribución normal. 😮
Vaya, David Aroesti utiliza ejemplos bastante interesantes de física. Me sorprende lo bien informado que está, no es muy común entre programadores e ingenieros. Creo que él hubiera sido buen físico y profe de física. 😄
https://github.com/karlbehrensg/programacion-dinamica-y-estocastica
Distribución Normal
La distribución normal es una de las distribuciones mas recurrentes en cualquier ámbito. Se define completamente por su media y su desviación estándar. Permite calcular intervalos de confianza con la regla empírica.
Regla empírica
También conocida como la regla 68-95-99.7. Señala cuál es la dispersión de los datos en una distribución normal a uno, dos y tres sigmas.
Permite calcular probabilidades con la densidad de la distribución normal.
uy, tuve dos cursos de estadística y me tocó ver esa vaina hasta en la sopa
Soy medico y en todos los estudios que la gente se hace (de azúcar para conocer su control de diabetes, de presión arterial para conocer el estado de hipertensión, etc), usamos desviaciones estándar.
Entonces los valores normales de glucosa, que son de 70 a 100, por ejemplo, son resultado de que mundialmente se tomó la glucosa a personas sanas y se estableció que la “normalidad” estadística de azúcar en sangre se encontraba entre estos valores.
Lo que esté por encima o por debajo de ese rango, no coincide con lo encontrado en personas sanas y por lo tanto debe estudiarse qué es lo que está causando esta anormalidad (enfermedad).
De hecho algunas enfermedades (como la baja tasa de crecimiento en niños, o sea, el que un niño se esté quedando pequeño en cuanto a su altura con respecto a sus compañeros o amiguitos de su edad), se cuantifican y tratan según el número de desviaciones estándar que está por encima o por debajo de la media de niños en México (o en según qué población) a la edad del pequeño. 😄
Recomiendo ampliamente, para una introducción sólida al tema, el siguiente sitio:
Normal Distribution
La explicación es accesible y muy clara.
Dejo un video para ampliar información
Ejemplo: Calcularla cantidad de alumnos en platzi que terminan un curso, y determiar la desviacion estandar segun a sus edades
En el trading podemos ver la distribución normal en la cantidad de operaciones que se realizan en un determinado periodo y determinar mediante la desviación estadar el numero de vendedores vs numero de compradores
Actualmente se encuentra que la curva de contagio de Covid 19 (coronavirus) obedece a uns distribución normal y también se menciona que dicha distribución es aplicable a la investigación del gusto de los usuarios/consumidores sobre los objetos artesanales y de diseño Para profundizar, leer el siguiente artículo de abril de 2020:
Al analizar datos e intentar modelos de regresión generalmente se tiene dentro de las hipótesis, que los errores son iid(0, sigma^2) con distribución normal. Obviamente se debe tratar de analizar si esta hipotesis es correcta, haciendo graficos qqplot, histogramas , ver si hay multicolinealidad ,…etc.
La distribución normal se podría observar si estamos revisando la cantidad de personas que visitan cierta aplicación en un horario determinado del día.
medir la intención de voto en la población
creo que cuando se describió el bozon de hiig
En las alturas y diámetros de los árboles con una misma edad
La mecánica de los gases de Maxwell
Fue la obra del astrónomo Quetelet (más abajo) quien puso a James Clerk Maxwell (1831-1879) en el camino de la mecánica estadística: las moleculas de un gas son como los individuos de una población, ya que el desorden a escala individual se transforma en orden a escala poblacional.
La curva de Maxwell indica cuántas partículas de gas se mueven a una velocidad determinada y se eleva suavemente desde velocidades bajas, alcanza el pico en la media, y vuelve a descender suavemente hacia las velocidades altas. Esta distribución muestra que la mayoría de las partículas se mueven a una velocidad alrededor del promedio.
![](
En las encuestas que dicen si GNU/Linux gana o pierde terreno en el sector de computadoras de escritorio :b
Facturas de venta de una empresa de un determinado periodo.
El resultado de los examenes
En mecánica cuántica everywhere.
Xd curiosidad morbosa chavos:
Saben que no solo aplica en esto que dijo David, sino que tambien sirve en la confiabilidad y aceptacion de datos en sistemas de control de calidad
Algunos test de “inteligencia”
Mientras más pequeña es la desviación estándar, la gaussiana es más picuda.
En mis clases tanto de estadistica inferencial, administración de proyectos y en la clase de control de estadistico de la calidad siempre usabamos la distribucion normal, era el pan de cada dia, y uno de los ejemplos que se vienen a mi mente es cuando por ejemplo una empresa que fabrica tubos quiere que una linea de produccion en particular produzca tubos de 5.5 metros de largo. entonces supongamos que al día producen 50 tuvos y miden cada uno y resulta que le media está en 5.5 (por ejemplo) con una desviación de 0.8 cm. digamos que la empresa acepta un margen de error 1 cm, eso quiere decir que la empresa acepta tubos que estan entre 5.49 metros y 5.51 metros. si la desviacion fue de 0.8 cm eso quiere decir que con seguridad el 68% de los tubos serán aceptados ya que 1 sigma (0.8 cm) es casi el mismo valor del margen de error que acepta la empresa.
entonces sabiendo eso uno puede saber que en la empresa hay muchos desperdicios y tambien puede saber que quizá en el proceso de fabricación haya problemas y por eso aproximadamente el 32% de los tubos salen defectuosos. (suponiendo que llamamos defectuosos a los tubos que tienen mas 1cm de margen de error).
este es un ejemplo de situaciones en las que se nos presentan distribuciones normales.
En encuestas, proceso de calidad de productos.
señales de comunicación
Las propiedades mecanicas de un material como fluencia y ruptura siguen una distribucion normal lo cual es muy importante en toda el area de la ingenieria mecanica y civil.
Las calificaciones de una escuela se pueden acercar a una distribución normal.
También cosas como la altura de una población.
En las edades de los estudiantes de Platzi.
Las calificaciones a final de semestre, lol
Les comparto un vídeo muy interesante de Javier Santaolalla en la que habla del criterio de significación de 5 sigmas, empleado para determinar si una observación es considerado un descubrimiento en la Física de Partículas
https://www.youtube.com/watch?v=iM1W_9ScCzs
A veces, la distribución de la recolección de datos puede tomar esta forma normal. Aunque algunas veces la distribución puede estar más acumulada en la derecha que en la izquierda o viceversa. En muchos casos, se presenta una distribución en forma de campana.
Todos los valores tienden a estar cerca de un valor en específico.
La media, la mediana y la moda normalmente son las mismas en una distribución normal.
En algunos muestreos, como la presión sanguínea y los resultados de un test, es común que se presente este tipo de distribución.
los periodos en los que llegan bastantes personas al pueblo creo
Una de mis “distribuciones favoritas” podría ser como el oleaje del mar, y justamente las aplicaciones actuales se hacen por medio de láser que apuntan al suelo marítimo y va midiendo la distancia que va teniendo el crecimiento de las olas. Esto es muy útil para plataformas petroleas e investigación sobre la marea. Además, que las olas gigantes son como los valores atípicos de la distribución. Si alguien quiere indagar más dejo este Artículo
yo lo uso para analisis de datos para modelamientos geologicos
Mis apuntes de la clase 📝
La distribución normal adapta una variable aleatoria a una función que depende de la media( X̅) y la desviación estándar(σ).
Esta distribución de probabilidad es una de las más recurrentes en cualquier ámbito, como las finanzas, sociología e incluso la psicología y un largo etc.
La forma de representar esta distribución es mediante una gráfica en forma de montaña (según el principito sería un elefante 🐘 dentro de una serpiente 🐍), llamada “campana de gauss” ó “campana gaussiana”.
.
La distribución normal es simétrica con respecto a la media, ya que de lado izquierdo se encuentran el 50% de los datos y del lado derecho el otro 50%.
Para representar esta distribución se necesitan:
Donde:
Donde
Podemos observar la distribución de varias formas, en la siguiente imagen hay dos ejemplos de ella
En ambos ejemplos, su media es de 10, sin embargo la desviación estándar es diferente.
Con lo anterior podemos decir que:
A mayor desviación estándar (σ ) mayor será la variabilidad en los datos.
También llamada “regla 68, 95, 99.7”, sugiere que cada dato que se puede observar caerá bajo tres desviaciones estándar (3 $\sigma$) diferentes de la media en una distribución normal.
De acuerdo con la regla tendríamos que:
El ejemplo anterior se puede representar en el siguiente histograma
Lo que nunca aprendí en mi pasada carrera de psicología en la universidad lo aprendí ahorita en menos de una hora 😄
Una vez hice un sistema en Excel que se encargaba de otorgar un puntaje ICFES (pruebas de Estado en Colombia) acorde a un simulacro a cerca de 30 estudiantes, tuve que utilizar distribución normal para dar un puntaje confiable.
Trabajaba lejos, debía ir en auto temprano, la carretera solitaria, en intersección un semáforo.
La primera semana calculé la probabilidad de hallar el semáforo en verde.
Al repetir el experimento varias semanas, pude darme cuenta de que no era conveniente ir rápido con tal de encontrar dicho semáforo en verde.
He vivido para contarlo.
Gracias estadística, gracias probabilidades.
La distribución normal las podemos encontrar en
-Las mediciones de una mismo objeto cuando la realizan varias personas
-Las tallas de zapatos de hombres o mujeres de cierta edad en diferente lugar
En el 2015 en la universidad junto con unos compañeros realizamos un pequeño experimento:
Cabe aclarar un par de cosas:
Evaluar el riesgo crediticio una vez se realice el relevamiento de los datos cuantitativos y cualitativos del cliente, cual es la probabilidad de que el cliente entre en mora?
Javier Santaolalla en este video explica un poco lo de las 5 sigmas en física.
https://www.youtube.com/watch?v=49epHjrRkVg&t=0s
El tema de distribución normal lo escuché muchas veces en las predicciones del clima, las encuestas electorales, anuncios de huracanes
la distribución normal la podemos ver en rangos salariales de un grupo o población o en los rangos de edad de una institución.
En astronomía, para determinar la velocidad de las galaxias, se usan varias distribuciones normales, donde cada una de las distribuciones se mezclan. Sobre estos estudios se concluyeron que solo el 20% de la materia gravitatoriamente activa es visible. El 80% restante es lo que se llama materia obscura.
En maquila es my común el uso de la distribución estándar para medir y controlar la calidad de lo que fabrican.
En esencia buscan disminuir la desviación estándar ya que esto garantiza que el 97.7777% de la producción este dentro de los parámetros de calidad.
Existen dos tipos de estadística, la descriptiva la la inferencial. En la primera se conoce toda la población y en la segunda solo una parte que le llamamos muestra.
La desviación estándar para estadística descriptiva se denota por $\sigma$ mientras que en inferencial se usa $s$.
El promedio en estadística descriptiva se denota por $\mu$ mientras que en inferencial solo se le coloca una ralla arriba del conjunto $\bar{x}$.
Pensemos en la estatura de todas las mujeres españolas; dicha altura sigue una distribución normal. Es decir, la estatura de la mayoría de mujeres estará cerca de la estatura media. En este caso, la altura media española es de 163 centímetros en las mujeres.
Por otro lado, un número similar de mujeres serán un poco más altas y un poco más bajas que 163cm; sólo unas pocas serán mucho más altas o mucho más bajas.
Existiría una distribución normal entre la altura de todas las personas mayores a 20 por ejemplo?
Hay que incorporar el coeficiente de variación al algoritmo de las estadísticas descriptivas. es simplemente dividir la desviación estándar sobre la media.
Comparto un video donde explican qué es la distribución normal
https://www.youtube.com/watch?v=phY8Z9-TXCY&ab_channel=Píldorasmatemáticas
Las computadoras cuánticas, son el futuro viejo.
Con los grados de confianza, tenemos nuestra modernidad.
La distribución normal, se basa en que en una desviación estándar se encuentran el 68% de los datos, luego en dos deviaciones estándar, se encuentran ya el 95% de los datos y en un 97.7% son 3 sigmas. Lo que casi que completa la totalidad de los datos.
Permite calcular probabilidades con la densidad de la distribución normal.
La regla empírica, nos dice cómo van destribuidos los datos: 68 - 95 - 99.7 que nos señala cuál es la disperción de los datos en una distribución normal a uno, dos y tres sigmas.
Cuándo realizamos inversiones, es inteligente y común, chequear la media del retorno a la inversión, para ver que sea estable.
Entre menos varíe la desviación estándar, tenemos una presición más grande osea que la disperción de los datos, es menor, osea que todo parece estar en un mismo sitio.
Las distribuciones normales, tienen una peculiar simetría con respecto de la media.
La distribución normal, la podemos definir por su definición estándar y su media
Incluso puedes convertir distribuciones en Normales, a través del teorema del límite central.
Podemos ver una distribución normal, en casi todos los conjuntos de variables.
La distribución normal, es la distribución más común y recurrentes en el mundo de la estadística.
El otro d freddy puso una distrubucion normal en un platzi live para referirse a que tipo de desarrolladores son los que pueden estar a salvo tras la llegada de github copilot
Creo que puede existir una distribución normal en las edades de las personas en una ciudad determinada.
En este apartado puedes encontrar lo siguiente:
La distribución normal la encuentras en algunas de estas variables:
A continuación les dejo el código para graficar en Colab el ejercicio de Media, Varianza, Y Distribución Normal. La ventaja de hacer en la nube de Google es que no se necesita configurar un ambiente local de trabajo.
PDTA: Utilicé parte del compañero Camilo Quiceno
import matplotlib.pyplot as plt
import random
import math
#Método que permite obtener la media
def media(X):
return sum(X) / len(X)
#Método que permite calcular la varianza
def varianza(X):
mu = media(X)
acumulador = 0
for x in X:
acumulador += (x - mu)**2
return acumulador / len(X)
#Método que permite calcular la desviación estándar
def desviacion_estandar(X):
return math.sqrt(varianza(X))
#Método para obtener la distribución normal
def distribucion_normal(X,mu,sigma):
valores_y = []
for x in X:
y = (1/(sigma*math.sqrt(2*math.pi)))*math.exp(-1/2*((x-mu)/(sigma))**2)
valores_y.append(y)
return valores_y
#Método para graricar los métodos anteriores
def graficar(X,valores_y,media,sigma):
#Media
media_y = [min(valores_y),max(valores_y)]
media_x = [media,media]
#Desviación Estándar
desviacion_estandar_1_y = [min(valores_y),max(valores_y)]
desviacion_estandar_1_x = [media+sigma,media+sigma]
#
desviacion_estandar_2_y = [min(valores_y),max(valores_y)]
desviacion_estandar_2_x = [media-sigma,media-sigma]
plt.plot(media_x,media_y,linewidth=2, color='b', label='Media')
plt.plot(X,valores_y,linewidth=2, color='r', label='Distribución normal')
plt.plot(desviacion_estandar_1_x,desviacion_estandar_1_y,linewidth=2, color='g', label='Desviación estándar')
plt.plot(desviacion_estandar_2_x,desviacion_estandar_2_y,linewidth=2, color='g')
plt.xlabel('x')
plt.ylabel('y')
plt.title('Distribución normal')
plt.grid()
plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.)
plt.show()
if __name__ == "__main__":
X = sorted([random.randint(0, 100) for i in range(100)])
mu = media(X)
Var = varianza(X)
sigma = desviacion_estandar(X)
valores_y = distribucion_normal(X,mu,sigma)
graficar(X,valores_y,mu,sigma)
print(f'Arreglo X: {X}')
print(f'Media = {mu}')
print(f'Varianza = {Var}')
print(f'Desviacion estandar = {sigma}')```
en optimización de procesos y en arboles de decisión
Hola amigos,
Para consolidar lo aprendido en esta clase, recomiendo mucho el siguiente enlace:
https://es.khanacademy.org/math/ap-statistics/density-curves-normal-distribution-ap/stats-normal-distributions/v/ck12-org-normal-distribution-problems-empirical-rule
¡Éxitos! 😃
Hola a todos, en este vídeo de Khan Academy pueden entender la fórmula de la Distribución Normal y cómo funciona.
.
Esta muy bueno, se los recomiendo 😃
https://www.youtube.com/watch?v=hgtMWR3TFnY
Esto si es raro . De distribuciones discretas se paso a distribuciones continuas . Supongo que para alguien nuevo en esto si se sentirá confundido pero animo a que no se rinda .
La distribución normal es una de las distribuciones mas recurrentes en cualquier ámbito de nuestra realidad( distribuciones de edades, lenguajes de programación, altura de personas en una poblacion, etc.)
Se define completamente por su media y su desviación estándar.
Media de la cantidad de horas dedicadas a un proyecto
Es curioso que cuando mides errores de experimento a veces te encuentres con distribuciones normales . Aun no logro explicar por que sucede eso .
La edad de inicio de consumo de alcohol en la población, en el índice de masa corporal, el número de cigarrillos que fuma alguien, la edad de inicio de vida sexual activa, etc.
que bien explicado
“The media playback was aborted due to a corruption problem or because the media used features your browser did not support”
😦
En las calificaciones de un grupo de estudiantes, o de los exámenes estatales.
En determinaciones de analitos por ICP, tanto de masas como de gas, se usa bastante para la normalización y estandarizacion de los metodos de analsis, junto con el uso de la prueba T, modelos de regresion, analisis residuales y propagación de errores (incertidumbres) podia llegar a revisar todos los factores de errores en la tecnica empleada, tanto aquellos sistematicos como los aleatorios.
Aprendí más de distribuciones normales en 8 minutos de clase con David, que en 4 horas de módulo en la universidad, jejejeje
Calificaciones de un examen
Distribución normal: En los resultados de los examenes universitarios. Acá en Colombia llamados Saber Pro.
Creo que una distribución normal seria el indice de obesidad en una población.
Podría encontrase en el campo de Visión computarizada al analizar con que probabilidad una imagen observada corresponde a un objeto.
También se conoce como la campana de Gauss.
Este artículo tiene más info… http://www.matematicasdigitales.com/la-herramienta-que-todos-quieren-la-campana-de-gauss/
alguien sabe como debo usar el teclado para escribir mas rápido ??
Interesante clase!
jajajjaj Levanto una piedra y encuentro una distribución normal!!! jajajaja muy bueno
La distribución normal se puede encontrar en las encuestas que nos realizan en los censos de la población.
¿Qué significa el eje de las y en las gráficas? o por qué la gráfica de la izquierda es más alta
En los salarios de los programadores
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?