Alguien mas esta sacando mas provecho de una explicación de 5 minutos en platzi que un trimestre de ingeniería?
Incertidumbre y probabilidad
¿Qué es la probabilidad?
Probabilidad en machine learning
Fundamentos de probabilidad
Tipos de probabilidad
Ejemplos de cálculo de probabilidad
Ejemplos avanzados con probabilidad
Distribuciones de probabilidad
¿Qué es una distribución?
Distribuciones discretas
Usando la distribución binomial
Distribuciones continuas
¿Cómo estimar una distribución?
MLE (Maximum Likelihood Estimation)
¿Qué es MLE?
MLE en machine learning
Regresión logística
Aplicación de regresión logística
Inferencia bayesiana
Teorema de Bayes
Bayes en machine learning
Retos finales
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Francisco Camacho
Aportes 67
Preguntas 10
Alguien mas esta sacando mas provecho de una explicación de 5 minutos en platzi que un trimestre de ingeniería?
Propiedades de una distribución binomial:
Los sucesos son colectivamente exhaustivos, es decir, al menos uno de los 2 ha de ocurrir. Si no se es hombre, se es mujer y, si se lanza una moneda, si no sale cara ha de salir cruz.
La variable aleatoria que sigue una distribución binomial se suele representar como X~(n,p), donde n representa el número de ensayos o experimentos y p la probabilidad de éxito.
Los sucesos son mutuamente excluyentes, es decir, no pueden ocurrir los 2 al mismo tiempo. No se puede ser hombre y mujer al mismo tiempo o que al lanzar una moneda salga cara y cruz al mismo tiempo.
Mi aporte sobre la distribución binomial, espero le ayude a alguien:
¿Como saber que distribución usar?
distribución de Bernoulli ó binomial
cuando la probabilidad de éxito no cambia
**Hipergeométrica **
cuando existe un tamaño de población N y hay n muestras de L números de éxito y de x que hay en la población. *se anexa imagen
poisson
cuando hay una población grande y una probabilidad pequeña *promedios de ocurrencia dentro de un periodo
t de student
determina si hay una diferencia significativa entre las medias de dos grupos.
Me está encantando este curso, hace rato esperaba algo así! 😀👍🏼
Pequeño typo en el minuto 13:19. Al expresar la ecuación de la distribución multinomial, el parametro k2 debe ser kn.
El curso esta muy bueno… dejo mis apuntes
Excelente clase !
Si quieren entender mas la distribución binomial, miren este video:
https://www.youtube.com/watch?v=8idr1WZ1A7Q&t=3s
DIstribucion de bernoulli: Es una funcion donde se tiene una variable variable con dos valores, Entonces
P(X) = p
P(¬X) = 1 - p
Distribucion binomial: Cuando se tiene secuencias repetitivas de varios eventos binarios(eventos tipos bernoulli). Todos los eventos son igualmente probables.
Existe un elemento matematico llamado el convinatorio, que sirve en este caso para lacular un numero k de ocurrencias en n intentos.
(k,n)= (n!)/(k!.(n-k)!)
donde (k,n) seria el convinatorio.
Con esto podemos calcular ya la distribucion binomial a traves de la siguiente formula:
P(k,n) = (n,k)P^(k)(1-p)^(n - k)
siento que platzi da explicaciones muy sencillas con ejemplos simples, es como si te llevara de la mano y te explicara con palos y manzanas lo mas simple, lo cual me viene excelente por que mi profesor sabia mucho y no sabia enseñar entonces se aventaba explicaciones y ejemplos poco amigables que me dejaban super confundido y con platzi todo esta claro, no siento que sea desafiante pero al menos me ayuda a entender la idea y eso vale muchismo
Distribuciones discretas
Para entender las distribuciones iniciemos explorando las distribuciones discretas.
Distribucion de Bernoulli:
Tambien conocidads como distribuciones binarias, si bien en el caso de un lanzamiento tiene una distribución sencilla podemos complicarla para visualizar las probabilidades de sucesos acumulados
P(X=0) = p
P(X=1) = 1-p
La probabilidad de que el suceso 1 ocurra n veces en un total de k sucesos es (donde p es la provabilidad del suceso 1 independiente)
Nota
Existen diversos tipos de distribución y nuestra labor en ML es encontrar la distribución que más se ajuste, la siguiente ecuación corresponde a una distribición multinomial
“Una distribución binomial es una distribución de probabilidad discreta que describe el número de éxitos al realizar n experimentos independientes entre sí, acerca de una variable aleatoria.”
Es muy sencillo de entender:
Una distribucion de bernoulli es solo Falso o Verdadero.
Y una distribución Binomial es incluir muchos bernullis, es decir repetir multiples veces un experimento.
Como sabemos, un experimento aqui solo puede tener 2 posibles resultados, Exito o Fracaso, y cada evento tiene una probabilidad asociada.
Entonces, para que se cumpla la probabilidad, debemos de fijar las siguientes reglas:
Entonces la formula se deduce asi:
Y esto lo multiplicamos por el numero de situaciones en las que se repite.
Por eso es:
Y como determino la cantidad de estados posibles? Es decir el denominador del combinator? Hay alguna formula?
Les dejo una simulación bastante sencilla para determinar por medio de experimentación la probabilidad de sacar 2 caras en 3 lanzamientos (3/8 o 0.375):
import numpy as np
n_lanzamientos = 3
iteraciones = []
n_iteraciones = 100000
for i in range(n_iteraciones):
lanzamientos = []
for lanzamiento in range(n_lanzamientos):
lanzamientos.append(np.random.randint(0,2))
iteraciones.append(lanzamientos)
dos_caras = 0
for lanzamiento in iteraciones:
if np.sum(lanzamiento)==2:
dos_caras += 1
print(dos_caras/len(iteraciones))
Otras distribuciones Discretas: Multinomial, Poisson, Geometrica, Hipergeometrica, Binomial negativa
Les comparto esta herramienta online que permite entender las distribuciones de probabilidad continuas y discretas, con sus definiciones y permite jugar con ella. También te permite encontrar la mejor distribución de probabilidad para un conjunto de datos phitter.io
yo: apoco si hago eso en la calculadora da 3/8
Lo hace en la calculadora
Yo:
Estos dos videos Bernoulli Distribution y Binomial Distribution me ayudaron mucho a entender los conceptos.
Por acá desempolvando mis libros de bioestadística va mi aporte:
Distribución Binomial o de Bernoulli
Este tipo de distribución se obtiene a partir de un proceso llamado ensayo de Bernoulli. Este último es un ensayo o experimento que puede conducir sólo a uno de dos resultados mutuamente excluyentes, es decir nos permite describir ocurrencias con variables que son binarias por ejemplo en el caso de lanzar una moneda solo hay dos posibles resultados cara o cruz (otros ej. muerto o vivo, enfermo o sano, femenino o masculino). En una secuencia de ensayos o proceso de Bernoulli, la distribución binomial nos permite calcular la probabilidad de obtener un resultado cualquiera (por ej. k éxitos), para un número n de pruebas independientes, para ello se deben cumplir las siguientes condiciones:
<$$
\begin{cases}
P(X=1) = p \\
P(X=0) = 1-p \\
\end{cases}
$$>
Un ejemplo con lanzamiento de monedas (confieso que lo detallé, para entender mejor lo que me cuesta entender 😃):
Problema: Queremos saber cuál es la probabilidad de obtener 3 caras si lanzamos 5 monedas “justas”:
Análisis:
El hecho es que al lanzar las monedas (todas a la vez o una por una) pueden caer de diferentes formas, entonces hay que saber de cuántas formas distintas (eventos) pueden caer las monedas y cuáles de esas formas (eventos) son favorables, para poder calcular la probabilidad = eventos favorables (o aciertos) / eventos totales.
1. SABER CUÁNTOS SON LOS EVENTOS (TOTALES) QUE PUEDEN OCURRIR: EL ESPACIO MUESTRAL (LO ESTABLECEMOS CON LA POTENCIA):
Para resolver este problema, primero identifiquemos el espacio muestral, que consiste en todas las posibles combinaciones de resultados de los lanzamientos de moneda. En cada lanzamiento, hay dos posibles resultados: cara © o cruz (X). Entonces, el espacio muestral para 5 lanzamientos consecutivos de moneda sería:
Escrito a mano sería:
Ω = {CCCCC, CCCCX, CCCXC, CCXCC, CCXCX, …}
Calculado sería:
Donde C representa una cara y X representa una cruz. Hay un total de 2^5 = 32 posibles resultados en el espacio muestral.
Como cada moneda puede tener 2 resultados posibles, se eleva a la potencia equivalente al número de 5 monedas
2. SABER CUÁNTOS SON LOS EVENTOS FAVORABLES QUE PUEDEN OCURRIR: COMBINACIONES FAVORABLES (LO ESTABLECEMOS CON LA COMBINATORIA):
Ahora, queremos calcular la probabilidad de obtener exactamente 3 caras en estos 5 lanzamientos de moneda. Podemos hacerlo utilizando el concepto de combinaciones. La fórmula para calcular las combinaciones es:
C(n, k) = n! / (k! * (n-k)!)
En la fórmula de las combinaciones, C(n, k), n representa el número total de ensayos o experimentos (en este caso, 5 lanzamientos), mientras que k representa el número de éxitos (en este caso, 3 caras) que se seleccionarán o se considerarán.
Esta definición es más general y aplicable a diferentes contextos y problemas. Por lo tanto, n se refiere al número total de ensayos o eventos posibles, mientras que k se refiere al número de éxitos o resultados deseados dentro de esos ensayos.
En nuestro caso, n = 5 (número total de lanzamientos) y k = 3 (número de caras que queremos obtener).
Aplicando la fórmula de combinaciones, obtenemos:
C(5, 3) = 5! / (3! * (5-3)!)
C(5, 3) = 5! / (3! * 2!)
C(5, 3) = (5 * 4 * 3!) / (3! * 2 * 1)
C(5, 3) = (5 * 4) / (2 * 1)
C(5, 3) = 10
Entonces, hay 10 formas posibles de obtener exactamente 3 caras en 5 lanzamientos de moneda.
3. SABER CUÁL ES LA PROBABILIDAD DE LOS EVENTOS FAVORABLES COMPARADOS CON LOS EVENTOS TOTALES O ESPACIO MUESTRAL: (COMPARAMOS CON LA DIVISIÓN):
Ahora, para calcular la probabilidad, dividimos el número de casos favorables (10) entre el número total de casos posibles (32):
Probabilidad = 10 / 32 = 0.3125
Por lo tanto, la probabilidad de obtener exactamente 3 caras en 5 lanzamientos de moneda es de 0.3125, que se puede expresar como 31.25% = 5/16
La respuesta de la probabilidad, 0.3125, se puede expresar como una fracción simplificada de la siguiente manera:
Probabilidad = 3125/10000
Si dividimos tanto el numerador como el denominador por 125 para simplificar la fracción, obtenemos:
Probabilidad = 25/80
Por lo tanto, la probabilidad de obtener exactamente 3 caras en 5 lanzamientos de moneda se puede expresar como 25/80.
Para simplificar aún más la fracción 25/80, podemos dividir tanto el numerador como el denominador por su máximo común divisor. En este caso, el máximo común divisor de 25 y 80 es 5. Dividimos ambos números por 5:
25 ÷ 5 = 5
80 ÷ 5 = 16
Por lo tanto, la fracción 25/80 se puede simplificar a:
5/16
Entonces, la probabilidad de obtener exactamente 3 caras en 5 lanzamientos de moneda se puede expresar como 5/16.
Una distribución discreta es una distribución de probabilidad que se aplica a variables aleatorias discretas, es decir, variables que pueden tomar solo un conjunto finito o infinito de valores discretos. Algunas distribuciones discretas comunes incluyen:
Distribución binomial:
Distribución de Poisson:
Distribución de Geométrica
Distribución de Hypergeométrica
Distribución de Bernoulli:
Es hermoso ver como todos los temas se van acomplando. Las graifcas, formulas y todos los conceptos matematicos relacionados al mismo tiempo
Combinator --> C(n,k) = n! / [ k! * (n-k)! ]
Esta super la Clase!
Es interesante el uso de distribuciones para la rama de machine learning. Si que se aprende mucho a aplicar este concepto.
.
.
Donde:
n
: Número total de opcionesk
: Número de éxitosn-k
: Número de fracasosp
: Probabilidades de un suceso exitoso1-p
: Probabilidades de un suceso no exitosoDe forma general describimos una distribucion de bernoulli como una funcion que a la variable binaria le asigna dos valores, donde la suma de ambas probabilidades seria igual a uno.
Recomiendo mucho este video sobre la distribución binomial aplicada a analizar la probabilidad de un suceso dado un conjunto de datos para complementar el tema:
Binomial distributions | Probabilities of probabilities, part 1
Graficando una distridución binomial con numpy y seaborn.
La distribución binomial es una distribución discreta que describe el resultado de escenarios binarios. Tiene tres parámetros.
n - número de intentos
p - probabilidad de ocurrencia de cada intento
size - tamaño del array que devolverá la distribución
Lancemos una moneda 10 veces, y vemoslo en un arreglo de un tamaño de 1000 datos.
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
sns.distplot(random.binomial(n=10, p=0.5, size=1000), hist=True, kde=False)
plt.show()
Distribución de Bernoulli
Variables con ocurrencias binarias
P(x=1)=p
P(X=0)=1-p
Distribución binomial
Secuencia repetitiva de eventos tipo Bernoulli
todoslos eventos igualmente probables
n lanzamientos P(k caras | n lanzamientos ) = combinator
p(k,n)= (n c k)
Distribución multinomial
La generalización natural de la binomial
Otras distribuciones
la probabilidad de obtener 2 caras o menos de 3 lanzamientos es la sumatoria de cada una de las probabilidad individual de cada lanzamiento (1,2.3).
Otra definición de la distribución de Poisson es la probabilidad de suceso de un número determinado de ocurrencia de un evento, por unidad de algo, con respecto a un parámetro central (media o promedio) que específica el número de presencia promedio de se mismo evento por unidad de alguna magnitud. P(X=x)=(l^x*e^-l)/x! Donde l (lamda) es una medida central promedio de ocurrencia de la variable X en un mismo intervalo.
Distribucion de Bernoulli
Nos permite describir ocurrencias con variables binarias como el caso de una moneda que al lanzarla solo hay dos posibilidades: cara o sello. Se define como una funcion que a la variable binaria le asigna dos valores:
P(X = 1) = p
P(X = 0) = 1 - p
La suma de las probabilidades siempre debe dar 1
En la Dstribucion de Bernoulli, por axioma, todos los eventos son igualmente probables. Cuando esto no se cumple, definimos un numero p que indica la variacion de la probabilidad para cada estado (eventos ponderados) el cual se ajusta cuando se trabaja con datos reales
Distribucion Binomial
Cuando tenemos secuencias repetitivas de eventos binarios (eventos de tipo Bernoulli) se habla de la Distribucion Binomial.
Ejemplo: Supongamos que tenemos tuna moneda que se lanza tres veces
En total son 8 posible estados
Ahora calculemos las probabilidades que de los 3 lanzamientos caigan k caras.
Como vemos, de los 8 estado que posee el EM solo 3 presentan esa posibilidad
P(2 caras | 3 lanzamientos) = 3/8
Si en vez de 3 lanzamientos tenemos n lanzamientos de los cuales queremos saber cuantos son k caras?
P(k caras | n lanzamientos) = ?
Entre mas lanzamientos, el espacio muestral crece mucho mas rapido que lo exponencial.
Viene dado por la Distribucion Binomial. Se construye a partir del Combinatorio el cual indica que dado n lanzamientos se obtenga k exitos a partir de n opciones donde las situaciones de exito ocurran de todas las maneras posibles (no tienen que suceder de manera ordenada) Nos ayuda a contar estados posibles de manera general para calcular las probabilidades.
(n k) = 3
P(1, 3) = 3/N° de estados = 3/8
Definimos la Distribucion Binomial: la Probabilidad de un suceso particular es igual al numero de estados que conducen a ese suceso multiplicado por la probabilidad de cada uno de esos estados:
P(suceso) = N° de estados * p
El numero de estados posibles se obtiene a partir del Combinatorio, mientras que la probabilidad de cada estado se obtiene del Espacio Muestral. La definicion formal es como sigue:
Distribucion Multinomial
Es la generalizacion natural de la binomial usada en el caso de un dado el cual tiene 6 posibilidades
Otras distribuciones
Hay ciertos experimentos aleatorios donde ciertas distribuciones aplican
Cuando se tiene un conjunto de datos donde no se sabe la distribucion que sigue existen tecnicas para ajustar la mejor distribucion a los datos
Cuando determina n lanzamientos, expande en dirección vertical al dibujo, mientras que la expansión de mas combinaciones debería estar dada de manera horizontal al menos. Porque lo que dice la imagen es que solo hay 3 lanzamientos de moneda, que se repiten, en varias secuencias.
Distribución multinomial
La Distribución binomial es una función de densidad de probabilidad, donde se puede calcular de una secuencia de eventos tipo bernoulli cuantos exitos se pueden obtener de variables aleatorias binarias.
El elemento que hablaba el profe en el minuto 7 sobre el combinador, otra forma de referirse al mismo es combinatoria sin repetición
https://es.wikipedia.org/wiki/Combinatoria#Combinatoria_sin_repetición
Distribucion binomial
Aprender a usar distintos tipos de distribuciones.
La clase esta genial.
En este vídeo explican cómo hacerlo con Excel:
La clase esta genial y de paso pongo una explicación más con un tema que apasiona que es "¿Qué posibilidades tengo de ganar la lotería?"
https://www.youtube.com/watch?v=JpIjBlS0gL0&ab_channel=ProfesorMiguelDelPozo
Sólo comentar que, en la distribución multinomial en el denominador aparece desde k1! hasta k2! me parece que debía ser desde k1! hasta kn!
Qué gran resume ha dado Francisco de algo que muchas personas no saben explicar, por suerte tuve un gran profesor en la universidad que me hizo amar las estadísticas y probabilidades a ta punto que con ellas trabajo día a día, vamos a echar código.
Que buena clase! 🤯
¿Cómo se calcula la probabilidad de que la moneda quede de canto?
#PreguntasQueNoTeDejanDormir
La mejor distribución a usar es la que se acomode a tus datos, hay métodos para identificar cual es la distribución más adecuada.
Razonamiento para definir la distribución binomial
Combinatorio
Si quieren saber el número de estados posibles, pueden usar la formula de Variaciones con Repetición de m elementos.
VR m,n = m^n
Donde en este caso en particular m sería la cantidad de estados posibles, y n las veces que tiramos la moneda.
Solo como nota por si se lo llegan a encontrar, a las funciones de probabilidad para variables discretas también se les conoce como funciones masa de probabilidad
fui estudiante de contaduría publica y en las clases de estadística me costaba entender estos puntos, de verdad esta metodología me gusta mucho mas
Excelente clase
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?