Distribuciones de probabilidad

Clase 23 de 35Curso Profesional de Data Science 2016

Resumen

Una distribución de probabilidad es realmente una tabla de búsqueda para ver qué tan probable es un resultado. Esos resultados son los valores de una variable aleatoria.

Así que cuando vemos una distribución de probabilidad que parece un montón de bloques
eso es lo que estamos haciendo, es sólo visualizar las probabilidades de observar cada uno de estos eventos.

Las variables aleatorias además pueden ser de 2 tipos:

  • Continuas: Pueden tomar cualquier valor dentro del espectro de números reales, por ejemplo: al decir entre 4 y 5 años existen los valores: 4.7, 4.9, 4.6242424242, etc.

  • Discreta: No hay valores intermedios que podamos observar, se pueden ver como "categorías, por ejemplo: decir que tenemos el color azul, verde, rojo, no se puede decir que tengo 0.5 de azul y 0.3 de verde.

Y justo para cada tipo de variable aleatoria tenemos funciones de distribución de probabilidad distintas:

  • Las funciones de densidad de probabilidad son las funciones de distribución de probabilidad
    para variables aleatorias continua.
  • Las funciones de masa de probabilidad son las funciones de distribución de probabilidad
    para variables aleatorias discretas.

Las funciones de densidad de probabilidad nos ofrecen un conjunto de información extremadamente rica sobre el cual basar las decisiones. Desafortunadamente, en el mundo real no se nos dan funciones de distribución de probabilidad.

Así que, lo que la estadística nos permite hacer es observar datos que recogemos en el mundo real y trabajar hacia atrás, tomar esos datos e inferir cuál podría ser la FDP subyacente que generó esos datos.