Componentes principales de la estadística

Resumen

La estadística empieza con un puñado de piezas que necesitas dominar antes de hacer cualquier análisis. Si quieres entender qué son los estadísticos en estadística, aquí vas a ver los componentes principales: experimento, población, muestra, eventos, variables y probabilidad, explicados con ejemplos cotidianos para que los apliques en datos reales.

¿Qué es un experimento en estadística y cuáles son sus tipos?

Un experimento es un procedimiento que puedes ejecutar una, varias o infinitas veces, y cuyos resultados pueden cambiar o repetirse. Según ese comportamiento, hay dos tipos clave [0:18].

¿Cuándo un experimento es aleatorio y cuándo determinista?

El experimento aleatorio entrega resultados distintos cada vez que lo corres. Tirar una moneda y observar si cae cara o cruz, o lanzar un dado y obtener un número del uno al seis, son los ejemplos clásicos.

El experimento determinista, en cambio, no cambia con el tiempo por más veces que lo repitas. Soltar una moneda y que caiga al suelo siempre que haya gravedad lo es. Otro caso: si el tráfico es constante, ir de un punto A a un punto B te tomará siempre el mismo tiempo [1:00].

¿Qué diferencia hay entre experimento aleatorio y determinista? El aleatorio cambia de resultado en cada ejecución, como tirar un dado. El determinista entrega siempre el mismo resultado bajo las mismas condiciones, como una moneda cayendo por gravedad.

¿Qué son población y muestra y cómo elegirlas bien?

La población es el universo total que estudias, el denominador grande sobre el que trabajas. La muestra es una extracción representativa de esa población [1:38]. Si tu población son los habitantes de Ciudad de México o Medellín, una muestra puede ser la población joven o la adulta, dependiendo de tu pregunta.

Elegir bien esa muestra es lo que separa un estudio confiable de uno que se cae al primer cuestionamiento.

¿Cómo saber si una muestra es estadísticamente significativa?

Una muestra debe ser representativa, es decir, lo suficientemente grande como para sacar conclusiones válidas. Si tu población es de un millón de habitantes y solo encuestas a 10, tu resultado va a ser erróneo: te falta recolección de datos. Eso es no ser estadísticamente significativo [2:14].

El tamaño correcto depende de la proporción de tu población. Hay calculadoras específicas para definirlo según el tamaño total.

¿Qué es una muestra sesgada y por qué evitarla?

Una muestra sesgada es aquella que solo cubre una parte de la población cuando el estudio necesita más amplitud. Si quieres estudiar comportamiento agregado, no puedes basarte solo en personas de 18 a 25 años o solo en una zona geográfica.

Esto pasa mucho en encuestas electorales: los partidos políticos envían cuestionarios para inferir qué candidatos tienen más posibilidades, pero si la muestra no es representativa de múltiples características, la inferencia falla.

Piensa en Spotify. Si haces un estudio sobre tu negocio, no puedes encuestar solo a quienes escuchan rock o solo a usuarios intensivos. Necesitas incluir pop, distintas edades y también a quienes escuchan poco, para que el resultado refleje el negocio completo [3:51].

¿Qué son los eventos y las variables en estadística?

Los eventos son los resultados finales de un experimento, los sucesos concretos. Al lanzar una moneda, los eventos posibles son cara o cruz. Al tirar un dado, son los números del uno al seis [4:35].

Las variables son las características o atributos de la población o muestra. En un Excel, son tus columnas: cada factor informativo que registras.

¿Cuáles son los tipos de variables: cualitativas y cuantitativas?

Las variables se dividen en dos grandes familias [5:00]:

  • Cualitativas: atributos categóricos como color de pelo o color de ojos.
  • Cuantitativas discretas: números enteros, como cuántas veces compraste un producto. No puedes comprar dos veces y media.
  • Cuantitativas continuas: aceptan decimales, como la altura o el peso.

Distinguirlas es esencial porque define qué cálculos puedes hacer y qué gráficos tienen sentido.

¿Qué es la probabilidad y qué es la probabilidad condicional?

La probabilidad mide qué tan probable es obtener un evento. Al tirar una moneda, hay dos resultados posibles: la probabilidad de cara es uno entre dos, igual que la de cruz [5:54]. La estadística es la ciencia que estudia qué tan probables son estos eventos.

¿Qué es la probabilidad condicional? Es la probabilidad de que un evento A ocurra dado que ya ocurrió un evento B. Mide cómo un suceso afecta la probabilidad de otro.

Un ejemplo claro: si llueve, ¿cuál es la probabilidad de que llegues a la misma hora a la oficina? Probablemente baja. O si comes mucho, ¿cuál es la probabilidad de sentirte mal después? Son probabilidades conjuntas en las que un evento sucede como consecuencia del otro [6:38].

Cuéntame en los comentarios qué experimentos aleatorios y deterministas se te ocurren de tu día a día.