Probabilidad compuesta y teorema de Bayes

Clase 21 de 27Curso de Estadística Descriptiva

Resumen

La estadística y la probabilidad son herramientas fundamentales que transforman nuestra percepción del mundo, permitiéndonos tomar decisiones informadas en lugar de dejarnos llevar por el azar. En esta exploración del diagrama de árbol y el teorema de Bayes, descubrirás cómo estas poderosas herramientas matemáticas pueden aplicarse para resolver problemas reales que van desde análisis de satisfacción de clientes hasta diagnósticos médicos. Prepárate para ver el mundo a través de la lente de la probabilidad.

¿Cómo utilizar el diagrama de árbol para calcular probabilidades?

El diagrama de árbol es una herramienta visual extremadamente útil para organizar y calcular probabilidades, especialmente cuando trabajamos con eventos dependientes o incluyentes (aquellos donde lo que sucede primero afecta la probabilidad de lo que sucede después).

Para ilustrar su funcionamiento, utilizaremos un ejemplo sencillo: imaginemos que tenemos un servicio con versión premium y no premium. Hemos entrevistado a 200 clientes (100 premium y 100 no premium) sobre su satisfacción:

  • De los clientes premium: 80 están satisfechos y 20 no están satisfechos
  • De los clientes no premium: 60 están satisfechos y 40 no están satisfechos

Para construir nuestro diagrama de árbol, comenzamos con un punto que representa el total de clientes. Este punto se ramifica en dos posibilidades:

  1. Clientes premium (P)
  2. Clientes no premium (P^c)

Luego, cada rama se divide nuevamente en:

  • Satisfechos (S)
  • No satisfechos (S^c)

Para calcular las probabilidades en cada rama:

  • Probabilidad de cliente premium: P(P) = 100/200 = 0.5
  • Probabilidad de cliente no premium: P(P^c) = 100/200 = 0.5
  • Probabilidad de satisfacción dado que es premium: P(S|P) = 80/100 = 0.8
  • Probabilidad de no satisfacción dado que es premium: P(S^c|P) = 20/100 = 0.2
  • Probabilidad de satisfacción dado que no es premium: P(S|P^c) = 60/100 = 0.6
  • Probabilidad de no satisfacción dado que no es premium: P(S^c|P^c) = 40/100 = 0.4

Es importante recordar que en cada ramificación, las probabilidades deben sumar 1.

¿Cómo calcular probabilidades condicionadas con el diagrama?

Para calcular la probabilidad de que un cliente esté satisfecho dado que es premium [P(S|P)], podemos usar la fórmula:

P(S|P) = P(S ∩ P) / P(P)

Donde:

  • P(S ∩ P) es la probabilidad de la intersección (cliente satisfecho y premium)
  • P(P) es la probabilidad de que sea premium

Para calcular la intersección con el diagrama de árbol, multiplicamos las probabilidades a lo largo de las ramas: P(S ∩ P) = 0.5 × 0.8 = 0.4

Ya sabemos que P(P) = 0.5, por lo que: P(S|P) = 0.4 / 0.5 = 0.8

Esto significa que hay un 80% de probabilidad de que un cliente esté satisfecho si sabemos que es premium.

¿Qué es el teorema de Bayes y cómo aplicarlo?

El teorema de Bayes es una herramienta matemática poderosa que nos permite "dar la vuelta" a una probabilidad condicional. Si ya sabemos P(A|B), podemos calcular P(B|A) sin tener que empezar desde cero.

La fórmula del teorema de Bayes es:

P(B|A) = [P(A|B) × P(B)] / P(A)

Siguiendo con nuestro ejemplo anterior, supongamos que queremos calcular la probabilidad de que un cliente sea premium dado que está satisfecho [P(P|S)].

Ya conocemos:

  • P(S|P) = 0.8 (probabilidad de satisfacción dado que es premium)
  • P(P) = 0.5 (probabilidad de ser premium)
  • P(S) = 0.7 (probabilidad de estar satisfecho, calculada sumando todos los clientes satisfechos: 140/200)

Aplicando el teorema de Bayes: P(P|S) = (0.8 × 0.5) / 0.7 = 0.4 / 0.7 ≈ 0.57

Esto significa que aproximadamente el 57% de los clientes satisfechos son premium.

¿Por qué es importante dar la vuelta a la probabilidad?

Ahora podríamos querer calcular lo contrario: ¿cuál es la probabilidad de que un cliente sea premium si sabemos que está satisfecho? Es decir, P(P|S).

Aplicando el teorema de Bayes: P(P|S) = [P(S|P) × P(P)] / P(S)

Sustituyendo con nuestros valores: P(P|S) = (0.57 × 0.5) / 0.7 ≈ 0.41

Esto significa que hay un 41% de probabilidad de que un cliente sea premium si sabemos que está satisfecho.

La interpretación es completamente diferente aunque solo hayamos invertido los términos. La primera nos dice la probabilidad de satisfacción entre los clientes premium, mientras que la segunda nos dice la probabilidad de que un cliente satisfecho sea premium.

¿Cómo aplicar estos conocimientos en la vida real?

La estadística y la probabilidad no están confinadas a las aulas; son de las matemáticas más aplicables a la vida cotidiana. Una vez que domines estos conceptos, verás el mundo de forma diferente:

  • Inversiones: Podrás estimar la probabilidad de éxito de tus inversiones basándote en datos históricos.
  • Medicina: Entenderás mejor lo que significa cuando un médico te dice que una prueba ha dado positivo (¿cuál es la probabilidad real de tener la enfermedad?).
  • Negocios: Podrás analizar el comportamiento de tus clientes y tomar decisiones basadas en datos.
  • Vida cotidiana: Desde decidir si llevar paraguas hasta elegir la ruta menos congestionada para llegar al trabajo.

El diagrama de árbol y el teorema de Bayes son herramientas que te permiten medir la incertidumbre y tomar decisiones más informadas en un mundo lleno de probabilidades. Ya no dejarás que las cosas simplemente "pasen" - ahora podrás analizarlas y entender sus implicaciones probabilísticas.

Los conceptos de probabilidad nos abren los ojos a una nueva forma de entender nuestro entorno, donde cada evento puede medirse y analizarse. ¿Has utilizado el diagrama de árbol para resolver algún problema cotidiano? Comparte tu experiencia y sigue explorando el fascinante mundo de la probabilidad.