Distribuciones Discretas: Bernoulli y Binomial

Clase 7 de 17Curso de Matemáticas para Data Science: Probabilidad

Resumen

¿Qué es una distribución de Bernoulli?

Las distribuciones de Bernoulli son fundamentales en la teoría de probabilidades y estadísticas. Son distribuciones de probabilidad que modelan variables aleatorias binarias, como puede ser el resultado de un lanzamiento de moneda: cara o cruz. En una distribución de Bernoulli, una variable aleatoria X puede tomar el valor de 1 (por ejemplo, cara) con una probabilidad p, y 0 (cruz) con una probabilidad de (1 - p). Este tipo de distribución es la base para comprender distribuciones más complejas.

  • Variables binarias: Los valores que toma X son discretos, normalmente 0 y 1, representando ocurrencias opuestas.
  • Probabilidades balanceadas o no: En un caso ideal, p sería 0.5, balanceando las probabilidades, aunque puede variar.

¿Qué es la distribución binomial?

La distribución binomial es una extensión de la distribución de Bernoulli y describe el número de éxitos en una serie de ensayos independientes, donde cada ensayo sigue distribuciones tipo Bernoulli. Consideremos el caso de lanzar una moneda varias veces: la binomial describe la probabilidad de obtener un número específico de caras (éxitos) en esos lanzamientos.

  • Espacio muestral: Si consideramos 3 lanzamientos de moneda, hay 8 resultados posibles.
  • Fórmula de probabilidad: La probabilidad de obtener un número “k” de caras a partir de “n” lanzamientos de una moneda es dada por la siguiente fórmula:
P(X = k) = C(n, k) * p^k * (1 - p)^(n-k)

Donde:

  • ( C(n, k) = \frac{n!}{k!(n-k)!} ) representa las combinaciones posibles de obtener ( k ) éxitos en ( n ) ensayos,
  • n es el número total de lanzamientos,
  • k es el número de caras que queremos obtener,
  • p es la probabilidad de éxito individual en un ensayo.

¿Cómo se representa gráficamente?

En la representación gráfica de una distribución binomial, el histograma muestra las frecuencias relativas de obtener 0, 1, 2,... caras en una serie de lanzamientos. La altura de cada barra representa estas probabilidades. Tomemos tres lanzamientos de moneda como ejemplo:

  • 0 caras: Probabilidad de ( \frac{1}{8} )
  • 1 cara: Probabilidad de ( \frac{3}{8} )
  • 2 caras: Probabilidad de ( \frac{3}{8} )
  • 3 caras: Probabilidad de ( \frac{1}{8} )

Fórmula específica para calcular probabilidades

El conteo de formas posibles de obtener un cierto número de caras en múltiples lanzamientos utiliza los coeficientes binomiales:

n = 3  # Número de lanzamientos
k = 1  # Éxitos deseados

probabilidad = C(n, k) * (0.5)**k * (0.5)**(n-k)

La interpretación práctica de estas fórmulas matemáticas permite entender cuántas combinaciones llevan a cierto resultado y cómo calcular la probabilidad de esos resultados.

  • Coeficiente combinatorio: Permite contar los diferentes órdenes en que pueden ocurrir estos "éxitos" y se representa con el factorial.
  • Probabilidad de éxito y fracaso: Multiplica las probabilidades de los casos deseados y no deseados, elevando a las potencias correspondientes.

La aplicación de estos modelos es crucial para muchas áreas, desde ingeniería hasta ciencias sociales, ayudando a resolver problemas de toma de decisiones bajo incertidumbre.

Más allá de Bernoulli y binomial

La probabilidad discreta no se limita solo a las distribuciones de Bernoulli y binomial. Existen otras como la distribución multinomial, la cual es una generalización de la binomial y se aplica en situaciones con más de dos posibles resultados, como el lanzamiento de un dado. Aunque no exploramos en detalle estas otras distribuciones, su comprensión es vital para modelar datos reales, más complejos, y hará parte de un aprendizaje contínuo en diversos cursos y prácticas. Este conocimiento es también integral para el desarrollo de algoritmos en machine learning, donde se busca modelar probabilidades más complejas a partir de datos.