Programación probabilística

1

Programación Probabilística: Fundamentos y Aplicaciones Prácticas

2

Probabilidad Condicional y Eventos Dependientes

3

Teorema de Bayes: Aplicaciones y Comprensión de Probabilidades

4

Teorema de Bayes: Intuición y Visualización Práctica

5

Cálculo de Probabilidad Condicional con Teorema de Bayes y Python

6

Aplicaciones Modernas del Teorema de Bayes

Mentiras estadísticas

7

Errores de Datos en Modelos Estadísticos y su Impacto

8

Detectar Manipulación en Gráficas Estadísticas

9

Correlación vs Causalidad: Evitando Errores de Razonamiento

10

Errores Comunes en el Muestreo Estadístico

11

Identificación y prevención de la falacia del francotirador

12

Detectar Manipulación de Datos con Porcentajes

13

Falacia de Regresión a la Media: Concepto y Ejemplos Prácticos

Introducción a Machine Learning

14

Historia y evolución del Machine Learning

15

Vectores Numéricos para Modelado en Machine Learning

16

Métricas de Distancia en Algoritmos de Machine Learning

Agrupamiento

17

Algoritmos de Agrupamiento: Clasificación y Aplicaciones Prácticas

18

Agrupamiento Jerárquico: Algoritmo y Visualización

19

Algoritmo K-means: Conceptos y Aplicación Práctica

20

Técnicas de Agrupamiento en Machine Learning

Clasificación

21

Técnicas de Clasificación en Aprendizaje Supervisado

22

Clasificación de Datos con Algoritmo K-Nearest Neighbors

23

Algoritmos de Clasificación en Machine Learning

24

Pensamiento Computacional: Fundamentos y Aplicaciones Prácticas

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Errores Comunes en el Muestreo Estadístico

10/24
Recursos

¿Cómo influye el error de muestreo en las inferencias estadísticas?

El error de muestreo es una de las barreras más comunes que enfrentamos al intentar realizar inferencias estadísticas válidas. Un muestreo adecuado no solo requiere aleatoriedad sino representatividad. Cuando carecemos de estas propiedades, los resultados obtenidos no pueden generalizarse a toda la población objetivo.

¿Qué es el error de muestreo y por qué ocurre?

El error de muestreo surge cuando nuestra muestra no es representativa del total de la población de interés. Esto ocurre frecuentemente en estudios de ciencias sociales, donde se observa que los participantes comunes son estudiantes universitarios, por la facilidad de acceso a ellos. Así, si el objetivo del estudio es entender a estudiantes universitarios, la muestra podría ser válida. Sin embargo, el error surge al pretender generalizar estos resultados a la población en general, ya que el subconjunto analizado no representa a todas las personas.

¿Cómo afecta el sesgo de muestreo la representatividad?

Ejemplos históricos, como la percepción de que nuestros antepasados Homo sapiens vivían mayoritariamente en cavernas, ilustran el sesgo de muestreo. Esta imagen es el resultado de que la mayor parte de la evidencia arqueológica procede de cavernas, no necesariamente porque todos vivieran en ellas, sino porque otros modos de vida no han dejado huella preservable. El sesgo de muestreo limita nuestra comprensión y lleva a conclusiones erróneas, subestimando la diversidad de modos de vida existentes.

¿Cómo lograr una muestra representativa?

El principio fundamental para una inferencia estadística confiable es que la muestra debe no solo ser aleatoria, sino también representativa. Esto significa incluir:

  • Diversidad geográfica: Incluyendo todas las regiones y países relevantes.
  • Demografía variada: Considerar variables como género, edad y nivel de ingreso.

¿Qué errores podemos evitar al interpretar los resultados?

Un error común al interpretar los resultados es sobrextrapolar las conclusiones de una muestra específica a una población general. Por ejemplo, al estudiar estudiantes de Platzi, es válido entender dinámicas específicas entre usuarios de esta plataforma, pero erróneo concluir sobre tendencias globales de educación en línea.

¿Cómo puede aplicarse este conocimiento en nuestra vida diaria?

Identificar el error de muestreo no es exclusivo de contextos académicos, sino que se presenta en muchos aspectos de la vida diaria. En el análisis de encuestas, informes noticiosos y estudios de mercado, debemos estar atentos a estas anomalías. Reflexionemos: ¿Dónde hemos encontrado este error en nuestra cotidianidad? Compartir estas observaciones nos permitirá mejorar nuestras habilidades analíticas y enriquecer discusiones.

Esta introspección y compartir experiencias ayuda a identificar y corregir errores de razonamiento presentes en nuestro entorno. Utilizar el sistema de comentarios para discutir estas situaciones puede abrir un espacio de aprendizaje colaborativo y enriquecedor. ¡Anímense a participar, compartiendo sus pensamientos y experiencias!

Aportes 104

Preguntas 4

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Es como esas encuestas de Twitter donde todos los de X ideología le dan a compartir lo mas posible, y al final quienes respondieron la encuesta fue un grupo homogéneo( precisamente quienes adhieren a esas ideas )

Y después, esa encuesta la usan como argumento para validar su creencia, es como un circulo de auto regocijo y validación .__.

Un ejemplo de esto es cuando quieres emprender. Haces un “estudio de mercado” y compartes una encuesta en todas tus redes sociales y con tus amigos. Casi todos responden que sí comprarían tu producto. El error aquí está en que son tus amigos y de cierta forma ya estaban pre-interesados en el producto.

Los periódicos en mi ciudad suelen hacer encuestas en facebook y las publican como una investigación representativa, pienso que nos son válidas por que muchas personas no tiene celular o cuenta en facebook, y este grupo es importante cuando definen temas como ser salud, educación o inclusive orientación política.

Los clásicos estudios que hacen las universidades, y paginas y programas de televisión difunden, así como tu lo mencionas

Estudios científicos en la universidad de **** muestran que:
*Si te gusta el café amargo tienes más probabilidades de ser un psicópata
*Si eres impuntual tienes alto IQ
etc, etc…

En mi pais hacen encuestas de solo 100 personas a gente de clase alta sobre problematicas de clase media : v .

En pocas palabras Una muestra proveniente de una área solo sirve para obtener conclusiones de esa área.

Se podría decir, en el caso del coronavirus, las personas estudiadas no es una muestra representativa ya que solo se estudian a las personas que muestran síntomas, sin embargo, hay personas que no presentan síntomas y entonces en ese caso en los datos que muestra cada nación sobre las personas infectadas no es representativa.

Un video de Freddy en el canal de Platzi, para terminar de cerrar conceptos de probabilidad y estadística: Link

Las encuestas de noticias caracol.

Les comparto algunos sesgos que se generan en la elección de la muestra
Sesgo por elección de la muestra

  • Sesgo por conveniencia: no hay una muestra variada

  • Sesgo por personal: Ejemplo, un político le pregunta al encuestado quien va a ganar las elecciones

  • Sesgo por respuesta voluntaria: si hay respuesta voluntaria hay sesgo, se elige a quien se le va a preguntar

yo no tengo ninguna pero quiero puntos xs

Un error que puede ser que en los estudios socioeconómicos de hace unos años, preguntaban siempre por el número de lamparas o focos que tenías en casa y asumían que el tener muchos focos era porque vivías en una determinada situación socioeconómica pero creo que estaba mal dado que en muchas ocasiones hay muchas personas de la misma familia viviendo en una sola casa y aunque tomen en cuenta el numero de habitantes, o si se cuenta con ciertos equipos electrodomésticos, éstos pueden ser compartidos por muchos.

En la universidad nos tocaba hacer un estudio de las personas que usaban bicicleta vs otros medios de transporte. La encuesta fue publicada en el grupo de las personas que se movían en bicicleta con el fin de tener mas datos.

Nos dio que la mayoría de las personas usaban bicicleta, lo cual no era correcto por que se hizo la encuesta en el grupo incorrecto.

Prejuicio de muestreo
No podemos realizar inferencia estadística si nuestros datos no son aleatorios. Si tenemos una muestra aleatoria de un grupo especifico de la población no podemos generalizar nuestros resultados a toda la población. Esto pasa muy a menudo puesto que muchas veces es difícil conseguir muestras de toda la población así que tomamos muestras de un subgrupo más accesible:

Ejemplos:

  • En la mayoría de estudios sociales los experimentos se realizan con estudiantes universitarios puesto que son un grupo muy accesible → esto nos da una muy buena muestra de los estudiantes universitarios, no así de la población en general
  • Todo lo que sabemos de nuestros antepasados (antes de la construcción de ciudades y la escritura) proviene de las muestras encontradas en las cavernas, sin embargo la mayor parte de la población vivía al aire libre donde es más difícil conservar la evidencia

hace muy poco se presento un estudio en donde el resultado arrojo que la mayoría de los habitantes con edad laboral en Chile ganaban casi mil dólares al mes como sueldo base o sueldo mínimo; es evidente que el estudio estuvo sesgado desde el comienzo ya que solo se realizo al 30% de los ciudadanos con mayor ingreso… un ejemplo claro de un error garrafal de muestreo

En las pruebas saber pro que realizan a los estudiantes en bachillerato, muchas de estas encuestan las hacen y varían mucho por que cuando se termina la secundaria le dicen al estudiante algo como, y ahora cual es tu camino a seguir, y en realidad muy pocos estudiantes lo tienen claro, varia mucho.

Por eso en industrias como la minera o la petrolera la fase de exploración y muestreo es muy costosa. Tanto si se concluye que la veta o la reserva es rentable como si no.

Creer que por que tengas pareja extranjera tendras un canal de YT y te ira bien… porque hay algunos con esas características… cuando existen MUCHAS personas con pareja extranjera sin un canal de YT

Mejor ejemplo que esta escena de Men in Black 3, imposible.
Solo 40 segundos y lo explica perfecto.

https://www.youtube.com/watch?v=ZkW6QCCjHoA

Imagina que se está realizando una encuesta política en un x país, las personas responsables de la encuesta hacen la encuesta únicamente en una zona urbana muy poblada, sin tomar en cuenta las poblaciones más rurales, como resultado la muestra será sesgada y tendrá una representación pobre tomando en consideración la población total

Sesgos en el razonamiento probabilístico:



  • <h3>Heurística de la representatividad</h3>
  • <h3>Insensibilidad al tamaño de la muestra:</h3>
  • <h3>Concepciones erróneas sobre las secuencias aleatorias:</h3>
  • <h3>El sesgo de equiprobabilidad</h3>
  • <h3>Enfoque en el resultado aislado</h3>
Las encuestas sobre si llega el Internet a todas partes, pero la encuesta es en facebook
Yo veo esos ejemplos de prejuicios muestrales cuando rankean universidades, si bien hay muchos factores que influyen en el resultado o puntaje de cada universidad los test no son claros en estos factores o variables (al menos en la prensa digital e impresa), en la mayoría de los casos no queda claro qué toman en cuenta, pues en cada institución se manejan de maneras particulares los campos de investigación, avances en análisis social, desarrollos tecnológicos, etc. cuando en realidad a nivel general una universidad implica mucho más que instalaciones, matriculados, políticas, tradición, grados, y un largo etcétera de trasfondo.

un ejemplo de esto puede ser la manera en que vena a LA desde US, porque algunos latinoamericanos sean criminales creen que eso nos representa a todos.

Tengo dos:

  1. He visto en noticieros algunos casos donde expresan los resultados de una encuestas como lo que opina “todo un país o ciudad” cuando la muestra es de mil personas xd
  2. Una investigación de mercado realizada a sólo personas que compraron tu producto, si el objetivo es conocer más tu público potencial se debe extender la muestra a quienes tengan características similares a tu segmento así no hayan consumido lo que vendes
Gracias
Las encuestas de los noticieros. Aquí en Colombia hay ciertos noticieros que hacen preguntas de actualidad a los televidentes y que la forma de responder bien sea por X o por las páginas oficiales. Al día siguiente no suelen especificar ni dar claridad de las conclusiones de los resultados. Además, siento que por default, aunque nos digan que los votantes son XXX cantidad de televidentes con acceso a internet, solemos generalizar los resultados. Un pequeño Ejempo: <https://www.youtube.com/watch?v=FXTyYsFFjdE>

Una vez leí que sacaron un muestreo de la cantidad de gente que habia muerto por covid en la parte donde vivo, una ciudad de unos 600 mil habitantes, entonces salio por las noticias que habian después de un tiempo que ya habian vacunas y todo, más muertos que infectados, pues resulta que no hacian los muestreos bien porque era departamental y no regional, osea en vez de hacer muestreo a 600 mil, lo hacian a más de un millon, además como no se estaba manejando bien el conteo de muertos por covid, metían gente que morian por algo totalmente ajeno a el covid

De forma general, estos son estudios observacionales y solo nos sirven para plantear hipótesis, mas no para realizar inferencias.

Les super recomiendo el libro del premio nóbel de economía, Daniel Kahneman: “Pensar rápido, pensar despacio”. En el, se habla sobre el funcionamiento del cerebro y cómo nuestra intuición lleva en muchas ocasiones a sumergirnos en sesgos completamente alejados de la realidad estadística. Explica también los mecanismos mediante los cuales nos engañamos en muchas circunstancias de nuestra vida diaria.

Voy a jugar un poco al conspiranoico.
Un ejemplo son las encuestas en época electoral. Los últimos años ganan candidatos “de la nada”. Entonces, uno se pregunta si realmente entrevistan y/o envían las encuestas a una variedad suficiente de personas. Además, es posible que se cometa el error adrede justamente tomando en cuenta que muchas personas votan de forma útil, “para que no gane X voto por Y”, y es posible que medios afines a algún@ candidat@ pretender hacer esta influencia sobre la elección.

Creo que los mayores errores los identifico en Twitter, cuando la gente cree que x tema de su preferencia es de la preferencia de todos. No entienden qué además del funcionamiento del algoritmo la gente que ellos siguen no puede ser representativa para afirmar lo que afirman. A lo anterior sumen que por ejemplo en Colombia solo el 2% máximo el 3% de la población usa Twitter, eso no puede ser representativo de nada ni podemos llegar a conclusiones con esa “muestra”. Saludos.

Las encuentas de los mercaderistas en grandes almacenes de cadena para ofrecerte una tarjeta de crédito

Es muy común ver a los noticieros partidistas haciendo encuestas políticas en las redes y luego presentando los resultados con gráficas y todo. Pareciera que ignoraran el hecho de que cierto tipo de personas son las que siguen a ese noticiero (los que comparten tal ideología política) y al mismo tiempo, olvidaran que las redes sociales no son tan utilizadas por personas mayores de 50-60 años.

Sin entrar en controversia, evidentemente no es lo que busco pero suena un poco al tema de la brecha salarial. Hay muchas particularidades que no se toman en cuenta, simplemente se toma el grueso de la población, se divide por género y se saca un promedio

Para corregir esta falacia del prejuicio en el muestreo o de que la muestra tenga una parte demasiado grande de una característica en la población, se usan técnicas de calibración de datos, donde a partir de una muestra de referencia se ajusta la muestra tomada para el experimento.

Cuando se pregunta por la popularidad de un político y la encuesta se hace en una institución educativa.

Necesitas aleatoriedad y representación, solo eso y ya tienes buenos datos.

Un ejemplo de mala persepción, es cuando nos imaginamos que todos nuestros antepasados, vienen de las cavernas, cuando estos vivían en diversos sitios, sin embargo, este prejucio está hecho, debido a que la mayoría de la evidencia que hemos encontrado, está en las cavernas. Conclusiones mal hechas.

Los errores de muestreo, pueden también deverse a la dificultad para tomar muestras de una población, por lo que se utiliza la técnica de la navaja de Ockham, la más fácil es.

Para que un muestreo pueda servur como base para la inferencia estadística tiene que ser aleatorio y representativo.

El prejucio en el muestro, elimina la representatividad.

Otro de los errores más comunes, son los prejucios en los muestreos.

Los medios o los políticos pueden mostrar datos como los de la brecha salarial por sexos, sin entender la diferencia entre un índice ajustado (comparamos salarios dentro de los mismos sectores, niveles de cualificación, etc…) y uno no ajustado (comparamos salarios ignorando cualquier otra variable). Ambos datos son útiles para entender la distribución de nuestras poblaciones y poder llegar a una situación más equitativa, pero en ocasiones se mal usan estos datos, que, siendo verídicos, hacen que generemos conclusiones erróneas. Estas conclusiones sesgadas pueden materializarse en leyes inútiles o incluso contraproducentes, ya que los legisladores no suelen ser estadistas. Menos David. David es todo.

Prejuicio en el muestreo


  • Para que un muestreo pueda servir como base para la inferencia estadística tiene que ser aleatorio y representativo.
  • El prejuicio de muestreo ELIMINA la representatividad de las muestras. Esto es muy común en los estudios de las ciencias sociales, ya que generalizan los resultados de las muestras a la población en general, haciendo la muestra no representativa.
  • A veces conseguir muestras es difícil, por lo que se utiliza a la población de más fácil acceso (casos de estudios universitarios).

Este video de Hernan Casciari explica de manera muy divertida este fenomeno:

https://www.youtube.com/watch?v=_wHXjs7PPTw

Supongamos que estás haciendo un estudio de mercado para saber cuanto estaría alguien dispuesto a pagar en maquillaje… si le preguntas a la persona que no usa estos productos… obtendrás una valoración incorrecta del producto.
Es muy importante elaborar pasos o filtros al momento de segmentar a fin de no sesgar el muestreo.

No tengo un ejemplo, pero es muy interesante la clase .

Un ejemplo que se ve mucho, son las encuestas politicas que realizan. Para las elecciones presidenciales de colombia por allá en el año 2014, era curioso ver todas las paginas en facebook de cada candidato donde mostraban resultados de intención de voto, y ponian al candidato como ganador a la presidencia, o el que pasaba a segunda ronda. En el ejemplo anterior, se ejemplifica de una manera genial el prejuicio de muestreo, dado que generalizaban a toda la población, al realizar una encuesta a las personas simpatizantes de un candidato.

Encuentro simitud cuando nuestro Sistema de activación reticular reconoce patrones de algo que estamos estudiando o haciendo y ya aparece en todos lados.

Un ejemplo que veo es cuando canales de televisión o radios (asociados a un movimiento político) hacen encuestas. Y como sus Televidentes/Radioyentes tienen la misma ideología la encuesta se ve y utiliza como argumentos de lo que le pasa o piensa toda la sociedad

Un ejemplo seria que todos los colombianos sean criminales/narcos. No es así ya que eso no es representativo de toda la población colombiana.

Tengo conocidos que basa sus investigaciones en análisis estadísticos donde ajustan su población a exclusivamente estudiantes universitarios para evitar estos errores. Claro que esto hace que sus investigaciones sean un poco menos representativas pero al menos lo especifican que trabajaran con cierto sector en especifico.

Para entender mejor esto. les recomiendo una página que muestra "correlaciones espurias". Aquí muestran muchas graficas con dos variables superpuestas que siguen la misma tendencia pero que no tienen relación entre ellas. p. ej número de gente que se ahogó al caer en un pozo y el número de películas donde Nicolas Cage. Siguen el mismo patrón pero obviamente no están relacionadas. https://www.tylervigen.com/spurious-correlations

en la uni tuve un proyecto en el que se necesitaba hacer encuestas a los usuarios finales, pero por culpa de un paro, la indiferencia de nuestros clientes y el covid solo se obtuvo la información de 4~5 personas

Notas:
El prejuicio de muestreo ocurre cuando generalizamos una estadística.
En un muestreo debemos hacer que este sea aleatorio y representativo en nuestra inferencia estadística.
Recuerda:
NO generalices tu población.

El muestreo de o por conveniencia es una técnica de muestreo no probabilístico donde los sujetos son seleccionados dada la conveniente accesibilidad y proximidad de los sujetos para el investigador.

Un error común son las encuestas telefónicas porque dejan de lado diferentes tipos de población

Un error frecuente en el área médica es pretender extrapolar los resultados de una investigación a enfermos que acuden a hospitales, ya que ellos representan únicamente a aquellos que tienen una forma más grave de la enfermedad.

Los señores de INVAMER deberían pegarse una pasada por este curso.

Esto tiene mucho que ver con el antes visto Teorema de Bayes.

Encuestas en redes sociales, encuestas electorales, discursos politicos, prehuicios. El machismo, ideologias radicales, religiones, deporte…

Inferencia estadistica valida:

  • Los datos se deben tomar de forma aleatoria.
  • Deben ser datos representativos.

Al hacer un estudio de mercado que va dirigido a cierto grupo con un poder adquisitivo medio y que la encuesta la estás dirigiendo a tus amigos de fb y se comparte con gente que tiene un poder adquisivo más bajo

Con los feeds y recomendaciones de facebook, twitter, youtube, instagram, debido a la información que se nos presenta asumimos que esas son tendencias generales en vez de pensar que los datos presentados son de acuerdo a nuestros gustos e intereses

Un ejemplo sencillo y recurrente, las encuestas de algunas firmas de consultoria y encuestas en elecciones para cargos publicos en el pais de Colombia, se selecciona con prejuicio a las personas para este proceso y al final se tienen encuestas distorsionadas de la realidad, ej: Popularidad o imagen favorable de un presidente y/o representante politico.

Para la exposición de mi tesis, yo estaba analizando la rentabilidad de las empresas bancarias de Perú. Un profesor me mencionó que había cometido un error al elegir a la muestra porque incluí a bancos que generaban rentabilidades por otros métodos (no por préstamos comerciales, sino corporativos), pero yo le refute que hacía un análisis del mercado desde la perspectiva de empresa reguladora que busca un indicador único para medir la rentabilidad general del sector. El profesor se quedó pensando un rato y dijo que todo ok jajaaja

Y el prejuicio puede pasar al revés? por ejemplo si se sacan conclusiones de los estudiantes de platzi a partir de una muestra a todos los estudiantes en linea? 🤔

Creo que un error de muestreo a propósito es el gerrymandering. Donde se definen los distritos electorales de formas especificas que beneficien a un partido politico u otro.

Comprendo, lo más importante es la Aleatoriedad y la Representatividad

la maravilla del muestreo radica en que el estimador de la muestra para poblaciones grandes arroja un numero pequeño, pero si la población es pequeña se necesita un porcentaje mayor de muestras para que sea representativo.

Por ejemplo saber cuántos hinchas de un equipo u otro existen en el país. Y más en un país donde los sensadores también son fanáticos, y que pueden alterar los resultados a su favor.

El ejemplo sería en las encuestas realizadas para determinar la posibilidad de que un candidato gane las elecciones. En la mayoría de los casos no se toma en cuenta la muestra que se encuentra en la parte urbana de una región, ademas de haber más factores; por ende no me parece que pueda ser representativa.

Lo he visto en mi trabajo al intentar llegar a conclusiones sobre el nivel educativo tomando como muestra sólo una sub-región o solo el sistema público.

Podrían ser los estudios que miden los índices de felicidad,ya que al ser algo aún subjetivo, no se contemplan todas las variables ni se sabe qué tan representativa puede ser la muestra pues el concepto varía mucho incluso dentro del mismo nivel socio económico

Excelente la historia de los hombres de las cavernas. Asi es que una idea errónea llega a volverse pensamiento generalizado.

Esos erorres se presentaban mucho en los trabajos de universidad de Estadistica, por pereza de ir a otros lugares a encuestar se conformaba uno con la población de la Universidad y lo peor de todo se iventaban datos.

En las pruebas de COVID realizadas en México, donde la muestra de la población a quienes se realzan test no son proporcionales y por lo tanto arrojan falsos resultados

un caso muy común, se presenta en la industria, donde se hacen muestreos para identificar un problema de calidad, pero solo se monitorean las variables que se piensa que están generando el problema, y se ignoran las están funcionando bien. Esto sesga el resultado, y casi siempre las conclusiones apuntan en la dirección equivocada.

Recuerdo que en la Universidad en la carrera nos pidieron que inventáramos un producto, y deferentes formas de venderlo, hiciéramos una encuesta de los diferentes precios del producto y saliéramos a las diferentes carreras a realizar las encuestas.

Comparto mis NOTAS:
Un error común es el prejuicio de muestreo, este prejuicio elimina la representatividad de la muestra.
A veces conseguir una muestra es muy difícil por lo que se utiliza a la población de más fácil acceso.
Lo importante es recordar que para generar una inferencia estadística válida, se necesita aleatoriedad, pero también es igual de importante la representatividad.

Siempre dije que el INDEC no necesariamente mentía, sino que alcanzaba con elegir mal la muestra.

Es fácil engañar con estadística haciendo bien todos los cálculos… elegí mal la muestra: fin!

En España en los casos de denuncias falsas de violencia de genero, en el cual solo el 0.0001% de los casos se afirma que son falsas, dejando en el otro 99% como verdaderas, pero el muestreo esta manipulado, dejo link https://www.youtube.com/watch?v=4mt4ELjDOKE&t=307s

Esto pasa típicamente en banca cuando se construyen modelos de admisión (para realizarle un préstamo o aprobar una tarjeta de crédito). Se suele modelar con las personas que lograron la aprobación del préstamo y se analiza a 12 meses como les fue con sus pagos. El error esta en que suelen ignorar a todas las personas que no lograron obtener el préstamo así que ese modelo no es del todo adecuado para predecir la probabilidad que alguien cumpla o no con sus obligaciones. Sin embargo, en banca se usa algo que se llama inferencia de denegados que son algunos métodos para tratar de remediar este tipo de sesgos.

En ocasiones la muestra no se escoge sesgada deliberadamente pero en otras sí. También se conoce como cherry picking, es decir, tomas muestras de toda la población pero las que no concuerdan con los resultados que quieres o con tu ideología las escondes en el cajón.
Un ejemplo de esto es el famoso estudio de los 7 países de Ancel Keys, donde se seleccionaron convenientemente 7 de 22 países para culpar a las grasas de las enfermedades cardiovasculares.

Soy economista y la verdad es que cuando encontramos relaciones causales se suele mirar casos muy específicos. Extrapolar los resultados a cosas más generales suele ser complicado - estudiando fenómenos económicos - , en otros campos como la medicina no pasa tanto. Sin embargo, hay un método que quizás nos da los mejores indicios de si hay causalidad que pueda ser extrapolada a un conjunto más grande de la población que son los meta-análisis. Sin embargo, sacar conclusiones generalizadas es complicado.

tengo uno y es sobre la idea que tenemos de cristobal colon

Para establecer Inferencias estadísticas válidas, debemos asegurar que la muestra es aleatoria y representativa.

Todo esto se traduce en que tenemos un sesgo cognitivo llamado SESGO DE CONFIRMACIÓN. les dejo un video muy interesante que lo explica con un juego:
https://www.youtube.com/watch?v=lWg7aXjv0sM

“Millones de moscas no pueden estar equivocadas: coma m…”

Me disculpo por lo fuerte de la frase, pero es uno de mis ejemplos favoritos porque así de fuerte es el facepalm que me doy al ver cosas como el terraplanismo, en su época cuando era creído por muchos, los demás también se guiaban porque era lo que la mayoría creía, así pues, hay una frase atribuida a Mahatma Ghandi: “la verdad, es la verdad, así sea que solo uno la crea” Es importante alimentar nuestro pensamiento crítico, y en política, ni les digo lo útil que es.

Lo he encontrado muchas veces en trabajos académicos. Por ejemplo, en uno de estos se apuntaba a estudiar el comportamiento en general de toda la población de la ciudad, en relación a un determinado tema; como puede ser inclinación cultural, pero al momento de revisar la información recopilada, la mayoría de las personas de las que se obtuvieron datos, se encontraban dentro de la universidad o en sus cercanías. Por lo tanto, claramente podemos ver que si bien la muestra pudo ser aleatoria, no era representativa de la población a la que se apuntaba.

En mi país no hay muchas ciclovías, y la manera para justificar su falta es contar cuantas personas en bicicleta son divisadas por tal zona. Además hacen encuestas donde preguntan cual es el medio de transporte usado por la población. Obviamente estos estudios arrojan que casi nadie usa bicicleta y que la ciclovía seria una gatos innecesario.
Esto en si es falso, porque la mayoría de personas de personas si usa y le gusta movilizarse en bicicleta, solo que obviamente no lo hacen debido a la falta de infraestructura y a la inseguridad que se siente.

Un ejemplo en particular es el feed de inicio de las redes sociales de cada persona, ya que es una muestra no representativa de toda la red social, esto porque está completamente adaptada (o sesgada) a lo que nosotros vemos o nos interesa. Por ejemplo, a mi me interesa la ciencia, por ello mis redes están llenas de contenido al respecto; sería erróneo concluir (o asumir implícitamente) que todas las personas están interesadas en la ciencia 😯.

Notas 😄
Prejuicio en el muestreo.

  • Para tener inferencia estadística valida debemos tener muestras aleatorias y representativas. En caso contrario, no podemos concluir de la población en general 🧩.
  • El prejuicio en el muestreo elimina la representatividad de las muestras. A veces conseguir muestras es difícil, por lo que se utiliza a la población de más fácil acceso (un ejemplo es el caso de estudio a universitarios 🏫).
  • Un error común es pensar que nuestros antepasados es que todos eran hombres de las cavernas (no hay manera de que haya evidencia fuera de una cueva) 🕳️.
  • La aleatoriedad no es suficiente, debemos asegurar representatividad (esta última es más complicada de asegurar, ya que se pueden crear sesgos) 🎲.

Se me ocurren 2 ejemplos

  1. Altura media de un país, pero todos los encuestados son jugadores de Básquetbol , obviamente la altura está sesgada

  2. Porcentaje de personas que consume alcohol en el país y los lugares seleccionado para tomar la muestra son bares

También el prejuicio vive en la mayoría de las personas cuando se habla de vacunas, un estudio realizado por la OMS demostró que por cada vacuna que se aplica contra el sarampión en estados unidos, se ahorran 16 dolares en costos de salud, el 80% de las personas están vacunadas lo que permite un ahorro de 3.000 millones de dolares cada año.

Lo que serviria para grabar todas las peliculas de marvel 2 veces xd

Un prejuicio de muestreo en la actualidad, sería el caso de las vacunas contra la covid-19, ya que hubieron unos cuantos casos en los que la vacuna tuvo algunas reacciones severas, pero no tomaron en cuenta las alergias y condiciones de los pacientes a quienes las aplicaron.

Un maestro una vez nos contó que pidió a sus alumnos obtener la altura promedio en chicos de una edad en específico y muy sabiamente fueron a registrar a los que eran parte del equipo de basketball

  • Si eres impuntual tienes un IQ mas alto.
  • Vestir lo mismo todos los días suele ser común entre personas con IQ mas alto
  • Los matemáticos no suelen ser buenos haciendo cálculos mentales.

Hoy en día con el tema del coronavirus han salido diferentes remedios caseros para evitarlo o combatirlo. En mi región por ejemplo, se habla mucho del interferón, un fármaco en gotas que hay que ponerse debajo de la lengua para evitar contagiarse ¿Por qué funciona? La respuesta suele ser, porque tengo varios amigos y conocidos que se lo están tomando, tienen frecuente contacto con la gente, y no se han contagiado.

Así mismo pasa con la moringa; las gárgaras con agua, limón y bicarbonato de sodio; y hasta con baños de “la sangre de cristo”

Las encuestas en elecciones