Contenido del curso
Una imagen vale más que mil datos
Estadística descriptiva
- 8

Distribuciones conjuntas en tablas dinámicas
08:26 min - 9

Medidas de Tendencia Central: Media, Mediana y Moda
13:49 min - 10

Media, mediana y moda en Excel con videojuegos
05:20 min - 11

Rango e índice intercuartílico en Excel
12:07 min - 12

Desplazamiento y escala en tus datos
08:31 min - 13

Cómo construir un boxplot paso a paso
06:47 min
Representación de datos
Muestra y error
¿Y la probabilidad?
- 19

Probabilidad simple vs experimental con dados y cartas
07:27 min - 20

Regla de la Suma en Probabilidad: Unión e Intersección de Eventos
10:45 min - 21

Eventos dependientes e independientes en probabilidad
06:29 min - 22

Teorema de Bayes con dados y fórmula
13:28 min - 23

Permutación vs combinación con cartas
03:19 min
Correlación y causalidad
Conclusiones
Sesgos que arruinan tus encuestas estadísticas
Resumen
El muestreo en estadística te permite obtener información representativa de una población sin entrevistar a cada persona, mientras que el sesgo es la variación que distorsiona tus resultados. Entender ambos conceptos es clave para diseñar estudios confiables y evitar conclusiones erróneas en investigaciones, encuestas o análisis de datos.
Entrevistar a millones de personas, como a todos los habitantes de la Ciudad de México, sería costoso y poco práctico. Por eso, seleccionas una muestra aleatoria y significativa para inferir valor sobre el total. Pero ojo: si esa muestra no se elige bien, aparece el sesgo.
¿Qué es el sesgo en estadística? Es una variación en los datos que impide que tu muestra represente fielmente a la población. No es un error como tal, sino una desviación sistemática que afecta los resultados.
¿Qué es el sesgo de respuesta y cómo evitarlo?
Este sesgo aparece cuando la herramienta o las preguntas que usas distorsionan lo que la gente contesta. Tiene dos caras principales que vale la pena distinguir.
¿Cómo afecta la deseabilidad social a una encuesta?
Si preguntas algo incómodo, como ¿alguna vez has robado?, es muy probable que tu población mienta o no responda. Las personas tienden a contestar lo que socialmente se ve bien, no lo que realmente hacen. Ese es el sesgo de deseabilidad social.
¿Por qué evitar las preguntas capciosas?
Una pregunta del tipo ¿te parece que esta marca es mejor que la otra? condiciona la respuesta a un sí o no. Pierdes la oportunidad de conocer la preferencia real. Una pregunta abierta, como cuál marca consideras mejor, te da información mucho más rica y honesta.
¿Qué es el sesgo de infracobertura?
Aquí tu muestra simplemente no alcanza a representar a la población. Se divide en tres variantes que conviene tener claras antes de levantar cualquier estudio.
- Sesgo de selección: eliges a los entrevistados de forma limitada. Si quieres datos de padres de un jardín de niños y solo entrevistas a las 17:00, dejas fuera a quienes trabajan por la tarde y solo dejan a sus hijos por la mañana.
- Respuesta voluntaria: aunque selecciones aleatoriamente, si algunos deciden no contestar ciertas preguntas, introduces sesgo en los datos.
- Muestreo a conveniencia: entrevistas únicamente a personas de tu calle o colonia para representar a toda una ciudad o país. La muestra queda atada a tu contexto y deja de ser representativa.
¿Por qué el sesgo de no respuesta es el más peligroso?
De nada sirve diseñar el estudio perfecto si solo el 5% de tu muestra responde. Ese porcentaje tan bajo no representa a la población y rompe toda la lógica del muestreo.
Es el sesgo que más error causa, porque puedes hacer todo bien hasta el último paso y aun así terminar con datos inservibles. Por eso, cuidar la tasa de respuesta es tan importante como elegir bien a quién entrevistar.
¿Qué pasa si mi tasa de respuesta es muy baja? Tu muestra deja de ser representativa, sin importar lo bien que la hayas diseñado. Una respuesta del 5% no permite inferir conclusiones válidas sobre la población.
¿Cómo identificar la dirección del sesgo?
La dirección te dice si estás sobreestimando o subestimando los resultados de tu muestra. Identificarla a tiempo te ayuda a corregir el diseño antes de sacar conclusiones.
Imagina que quieres estudiar diferencias de género con 50 personas, pero eliges a 40 hombres y 10 mujeres. Si tu análisis depende del género, el experimento va a fallar porque la muestra está desbalanceada. La solución es construir una muestra aleatoria que conserve la paridad entre hombres y mujeres.
Lo mismo aplica con intervalos de edad o posturas políticas distintas: necesitas equilibrio para que cada subgrupo aporte información proporcional. Cuéntame en los comentarios qué tipo de sesgo te ha tocado enfrentar en tus propios estudios.