Identificación y prevención de la falacia del francotirador

Clase 11 de 24 • Curso de Introducción al Pensamiento Probabilístico

Contenido del curso

Programación probabilística

Mentiras estadísticas

Introducción a Machine Learning

Agrupamiento

Clasificación

Tomar examen

Resumen

Cuando analizamos datos sin considerar la aleatoriedad, corremos el riesgo de encontrar patrones donde no los hay. Esta es precisamente la trampa que plantea la falacia del francotirador de Texas, un error lógico que aparece con frecuencia en ciencia de datos, inversiones y hasta en estudios científicos publicados. Comprender cómo funciona es fundamental para construir conclusiones válidas a partir de evidencia real.

¿Qué es la falacia del francotirador de Texas?

La imagen que da nombre a esta falacia es tan memorable como ilustrativa [0:42]: un hombre dispara múltiples veces contra un establo sin apuntar a ningún blanco. Después de disparar, pinta la diana alrededor del grupo de impactos más cercano y se declara un tirador experto. El problema es evidente: la hipótesis no existía antes de observar los datos.

Esta falacia consiste en no tomar la aleatoriedad en consideración [0:04]. También ocurre cuando nos enfocamos demasiado en las similitudes entre datos sin verificar que nuestra muestra sea suficientemente amplia para afirmar que esas similitudes son relevantes.

Un ejemplo claro es observar la explosión de un volcán o una estrella y concluir que el universo está repleto de energía explosiva a gran escala [0:18]. En realidad, la mayor parte del universo está vacío. La muestra no contempló un panorama suficientemente amplio ni consideró la distribución aleatoria de la energía.

¿Por qué recolectar datos antes de tener una hipótesis es un error?

Una forma muy común de caer en esta falacia es comenzar a recolectar datos antes de formular una hipótesis [1:00]. En el mundo de data science, muchas compañías acumulan enormes cantidades de información esperando que los científicos de datos encuentren patrones después de ver los datos. Este enfoque es problemático porque la hipótesis se construye ad hoc, es decir, se adecúa directamente a los datos disponibles en lugar de plantearse de forma independiente antes de la recolección.

El segundo error es no preguntarse cuál es la probabilidad de que, simplemente por azar, los datos muestren ese patrón [1:28]. Si no evaluamos la randomness, cualquier agrupación puede parecer significativa.

¿Dónde aparece este error en la vida real?

Los ejemplos son más cotidianos de lo que parece [1:40]:

Emprendedores seriales que se enfocan únicamente en las empresas que les funcionaron e ignoran las que fracasaron. Después de varios intentos, señalan el éxito y se declaran grandes emprendedores.
Portafolios de inversión donde la gente tiende a destacar las decisiones acertadas del gestor del fondo y a pasar por alto las decisiones que resultaron mal.
Ambas perspectivas —lo que funcionó y lo que no— deben entrar en la ecuación para construir conclusiones válidas.

¿Qué enseña el estudio de Suecia sobre cables de luz y cáncer?

En Suecia se realizó un estudio amplio que buscaba determinar si los cables de luz estaban relacionados con el cáncer [2:08]. Los investigadores encontraron un clúster, un grupo geográfico donde había alrededor de ochocientas personas con cáncer cerca de ciertos cables. El número parecía alarmante.

Sin embargo, el estudio falló al no considerar cuál era la probabilidad de que, aleatoriamente, existieran ochocientas personas con cáncer en esa área [2:36]. Al correr los números, la probabilidad resultó ser aproximadamente del cincuenta por ciento, lo cual significa que era prácticamente aleatorio. Un número en lo abstracto, sin contexto poblacional, no permite llegar a ninguna conclusión sólida [2:25].

Este caso ilustra perfectamente que entender la población total es indispensable antes de extraer conclusiones.

¿Cómo evitar caer en la falacia del francotirador?

Para que las conclusiones sean correctas y estadísticamente válidas, es necesario cumplir con dos condiciones fundamentales [3:00]:

Extraer muestras aleatorias.
Asegurarse de que sean muestras representativas.

Si fallamos en cualquiera de estos criterios, probablemente estemos frente a un error de prejuicio o frente al sharpshooter fallacy. La clave está en formular la hipótesis primero, recolectar datos después y siempre evaluar si el patrón encontrado podría explicarse simplemente por el azar.

¿Conoces algún caso donde alguien vio datos y saltó a una conclusión sin hipótesis previa? Comparte tu historia en los comentarios.

Comentarios

Gerald Zamora

student•

A todos nos ha pasado que vas respondiendo un examen y ya llevas varias C seguidas, crees que esta mal, pero no tomas en cuenta que aleatoriamente es posible

Luis Fernando Pedroza Taborda

student•

Si pasa mucho en los examenes de selección multiple con unica respuesta, comienza uno a dudar lo que a la final resulta ser malo.

Ignacio Eduardo Muñoz Damanes

student•

Aquel momento es cuando hay que aplicar la técnica de , D de diosito.

Julian Omar Meza

student•

Este es un ejemplo de los impactos que recibian los aviones estadounidenses durante la segunda guerra mundial. Al ver la imagen se piensa que las zonas con mayor cantidad de impactos son las que tienen que ser reforzadas o mejorara el blindaje, pero es exactamente al revés, estos impactos son de los aviones que SI regresaron del combate.

Jose Colmenares

student•

Creo que esto era muy frecuente durante mi carrera de Ing. Electrónica. En los laboratorios a veces solo tomabas los resultados que se corerspondían con lo que sabías que debías obtener y obviabas todos los demás.

Jhony Urbano Diaz Quispe

student•

ajustar los datos a la respuesta jajaaj un clasico

Oscar Francisco Trujillo Puentes

student•

Hola,

En mi caso fueron los diferentes laboratorios de la universidad. Ajustamos los datos para tener una respuesta muy cercana a la teórica con el fin de evitar problemas al momento de hacer conclusiones o análisis.

Felipe Cortés

student•

“Hoy soñé que tenía doce años. En la lotería salió el número 3. El sueño lo advirtió porque 1+2=3”.

Angel Francisco Flores Ayala

student•

Todas las pseudociencias y teorías de conspiración hacen uso de está falacia, desde la homeopatía hasta los que creen que la Tierra es plana. Por poner el ejemplo de la homeopatía (o cualquier medicina 'alternativa'), primero dicen que X producto cura alguna enfermedad, y después buscan testimonios para comprobar lo que dicen, pero no toman en cuenta a todas aquellas personas que no les funcionó.

Alfredo Gómez Delgado

student•

tome su buen "me gusta" a su comentario; tienes toda la razón

Matías Collado

student•

Hasta las religiones entran en el mismo grupo anti estadístico.

Mateo Echavarria

student•

Los títulos de las clases de David Aroesti, siempre de hacen anhelar ver la clase, te despierta la curiosidad en todo momento.

Daniel Martinez Diaz

student•

Es como clickbait, pero sin las traición del clickbait.

Juan Ventrone

student•

Pensaba que uno de los metodos era recopilar datos y luego analizar, veo que es un metodo que me llevaria a la falacia del francotirador

Jhony Urbano Diaz Quispe

student•

Creo que esto también funciona siempre y cuando no fuerces una respuesta.

Juan Ventrone

student•

Exacto Forzar tambien un resultado nos llevaria a la falacia del francotirador

Gonzalo Ferrando

student•

Excelente la Falacia del Francotirador. "La gente tiende a enfocarse en lo que se hizo bien y no también en lo que se hizo mal"

Gerardo Ruben Marin Riveroll

student•

Supongo que es algo muy común y parte de la razón por la que los horóscopos son tan populares.

Daniel Miranda

student•

Tienes razón, cuando las personas leen ignoran la aleatoriedad de las descripciones, se enfocan en lo que confirma sus creencias.

Alveiro Mejia Lopez

student•

un buen ejemplo de la falacia del francotirador es Alienígenas Ancestrales, todo ajusta "sospechosamente bien"

Luis Fernando Pedroza Taborda

student•

Si es cierto Alveiro, no se logra obtener evidencia valida y por eso lo mas probable es que se tengan resultados invalidos.

Juan Nuñez

student•

Hay quienes esto lo conocen como "Cucharear" los resultados. Cuando se hace un experimento y se obtienen datos fuera de lo predicho, se encajan a fuerza en el modelo.

Wilson Delgado

student•

En mi país se le dice machetear

Alejandro González Bautista

student•

Se presentan con bastante frecuencia en ciencia, en investigaciones o reportes de algún laboratorio se tiene la necesidad de que los resultados obtenidos en la parte experimental empalmen casi perfectamente con los teóricos y no como realmente se obtuvieron, se manipula la información obtenida para obtener un resultado deseado, a lo cual muchos lo conocen como "cuchareo"

Carli Code

teacher•

Alguien sueña con el número 7 y juega algo... No sale el 7 y sale el número 362 Se da por confirmada la premonición, alegando que 3+6-2 es igual a 7

Jonny Alexander Morales Gallo

student•

Alguna vez vi 3 automóviles con el número 576 el mismo día y fui a jugar la lotería y a que no adivinan :-) no salió el número

Juan Pablo Jimenez

student•

Falacia del francotirador de Texas

Esta falacia se da cuando no se toma la aleatoriedad en consideración.
También sucede cuando uno se enfoca en las similitudes e ignora las diferencias.
Cuando fallamos al tener una hipótesis andes de recolectar datos estamos en alto riesgo de caer en esta falacia (es muy común en Data Science).

Un hombre dispara directamente al establo, y dispara por todas partes y una vez que ya termino de disparar, pinta la diana. La "Hipótesis" no estaba puesta antes de que empezara a disparar sino que la puso "Ad Hoc " es decir, se adecuo directamente a los datos que tenían, no de manera inversa. Tampoco se toma en cuenta la aleatoriedad al pintar directamente la diana.

Esto sucede en muchos lugares, como cuando alguien se enfoca en las empresas que si le funcionaron e ignora las que no le funcionaron. Es decir, una vez que ya hizo todas sus empresas dice "Soy un gran emprendedor por que esta me funciono".

Para que nuestras conclusiones sean validas/correctas tenemos que extraer muestras aleatorias y representativas, si fallamos en uno de estos casos, probablemente nos encontremos con un error de prejuicio o con la falacia del francotirador de Texas.

Isabel Yepes

student•

Como dijo Carl Sagan en su programa Cosmos, cuando estaban mirando hacia Venus. Observación: No se puede ver nada Conclusión: Dinosaurios

Gerardo Jesus Ignacio Villacorta

student•

Ya no está disponible

Israel Yance

student•

En analítica web es común tratar de recolectar la mayor cantidad de datos y después buscar patrones en ellos.

Robin Tristan Calvo Ribera

student•

Me acabo de dar cuenta que justo al analizar los posts de Facebook de la empresa traté de sacar conclusiones a partir de los datos, pero debí probar hipótesis, porque probablemente estoy matando tipos de contenido que no han demostrado su valor.

Anthony Abrahams Josue Piñero Rodriguez

student•

Es posible que podamos tener ejemplos donde no se incluya el cancer?

Korpi delfin

student•

Hola Apiro!

Lo tendremos en cuenta para futuras versiones del curso. También puedes enviar tus observaciones a team@platzi.com, el feedback de los estudiantes es importante y lo toman muy en cuenta :D Coméntales tu situación.

¡Nunca pares de aprender! 💚

Josue Noha Valdivia

student•

Falacia del Francotirador de Texas Sucede cuando no se toma en cuenta la aleatoriedad, enfocándonos demasiado en las similitudes e ignorando las diferencias, o cuando recolectamos datos antes de tener una hipótesis generando así hipótesis ad hoc, es decir adecuada (con calzador) a los datos obtenidos Ejemplo En un estudio en Suecia se llegó a la conclusión de que los cables de luz causaban cancer, puesto que había un número considerable de personas con la enfermedad que vivían cerca a un nudo de muchos cables. Sin embargo esta cantidad de personas enfermas puede explicarse por la aleatoriedad.

John Mario Giraldo Cubillos

student•

O tampoco se considera el hecho de uan mayor cantidad de cables de luz indica una mayor concentración de personas, por lo cual existe una mayor posibilidad de casos de cancer, frente a una zona con pocos cables indicaria una menor población.

Josue Noha Valdivia

student•

Gracias por la acotación

Identificación y prevención de la falacia del francotirador

Programación probabilística

Programación Probabilística: Fundamentos y Aplicaciones Prácticas

Probabilidad Condicional y Eventos Dependientes

Teorema de Bayes: Aplicaciones y Comprensión de Probabilidades

Teorema de Bayes: Intuición y Visualización Práctica

Cálculo de Probabilidad Condicional con Teorema de Bayes y Python

Aplicaciones Modernas del Teorema de Bayes

Mentiras estadísticas

Errores de Datos en Modelos Estadísticos y su Impacto

Detectar Manipulación en Gráficas Estadísticas

Correlación vs Causalidad: Evitando Errores de Razonamiento

Errores Comunes en el Muestreo Estadístico