No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Bias y GIGO en datos

5/20
Recursos

Bias es un anglicismo que significa sesgo. Este fen贸meno sucede cuando deseamos estudiar una poblaci贸n y, para ello, partimos de una muestra que no es estad铆sticamente significativa.

De otro modo, la expresi贸n GIGO significa 鈥basura entra, basura sale鈥. Esta frase se fundamenta en el principio que dice 鈥la calidad del resultado (output) depende de la calidad de la entrada (input)鈥.

Para que los datos representen las verdaderas caracter铆sticas de la poblaci贸n estudiada se debe prestar especial atenci贸n a estos dos aspectos: Bias y GiGO.

De igual modo para que los resultados de un an谩lisis de datos sean efectivos y permitan una correcta interpretaci贸n de la realidad que pretenden explicar, es muy importante la calidad de estos y que su recolecci贸n obedezca a criterios cient铆ficos. Por consiguiente, es indispensable que estos datos realmente recojan las caracter铆sticas de la poblaci贸n que se desea estudiar, es decir, que realmente sean representativos.

Bias o sesgo

En otras palabras, el sesgo se origina cuando se selecciona la informaci贸n de manera err贸nea y se considera una muestra que no representa la totalidad de la poblaci贸n. En este caso, la muestra aleatoria no es representativa.

Ejemplo de estudio

Supongamos que queremos estudiar el comportamiento de la poblaci贸n de Medell铆n en determinados aspectos. Para ello, seleccionamos 100 personas, distribuidas en 80 hombres y 20 mujeres.

Ahora bien. seg煤n los datos del censo 2018, el Departamento Administrativo Nacional de Estad铆stica -DANE- de Colombia, indica que esta ciudad tiene una poblaci贸n cercana a los 2.5 millones de habitantes, distribuidos en 47% hombres y 53% mujeres, lo que la hace la segunda ciudad m谩s poblada de Colombia.

Surge la siguiente pregunta 驴Si Medell铆n tiene aproximadamente 2.5 millones de habitantes de los cuales 47% son hombres y 53% son mujeres, piensas que los datos de 100 personas seleccionadas al azar donde 80% son hombres y 20% son mujeres realmente son representativos? Seguramente tu respuesta a esta interrogante es que no es representativa.

Por esta raz贸n, debemos asegurarnos de que el n煤mero de datos que poseemos sea significativamente grande y correctamente distribuida para sacar conclusiones de c贸mo se comporta la poblaci贸n en Medell铆n.

Esta situaci贸n ha sucedido en ejemplos pr谩cticos sobre todo en reconocimiento facial. Hist贸ricamente las empresas que se han dedicado al reconocimiento facial han tenido m谩s muestras de personas blancas que de personas de piel oscura, por tal motivo se ha creado un sesgo. Eso pone en riesgo la informaci贸n, porque no podemos identificar a una poblaci贸n importante dentro del mundo.

Garbage in Garbage out (GIGO)

As铆 pues, debemos asegurarnos de tener calidad en los datos y en la fuente de acceso, cantidad de datos suficientes, tipolog铆a de datos, entre otros, para que nuestros resultados sean de calidad.

Si no tenemos una fuente confiable para obtener nuestros datos, estos no van a permitir una conclusi贸n relevante o fidedigna. Por lo tanto, se precisa recolectar un buen input para tener un buen output.

Reto

Adem谩s de estos dos fen贸menos que se han comentado, te invito a que pienses en otros tipos de sesgos y errores que incurren las empresas y el sector p煤blico. No olvides compartir tus conclusiones y tambi茅n escr铆belo en tu gu铆a de retos.

Contribuci贸n creada por Avilio Mu帽oz Vilchez

Aportes 164

Preguntas 5

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

Yo en otro curso hab铆a visto de los sesgos, me pareci贸 impresionante, porque nosotros en nuestra vida cotidiana tambi茅n caemos en segos cognitivos, aqu铆 les dejo un par de ejemplos de estos sesgos:

1.Aversi贸n a la p茅rdida
Consiste en considerar que es m谩s importante la posibilidad de perder algo que la posibilidad de conseguir algo de igual valor. Debido a este sesgo, muchas personas consideran que perder tiene m谩s impacto que ganar, incluso en aquellas circunstancias donde ganar o perder puede ocurrir con las mismas probabilidades.

2. Efecto Forer
El efecto Forer es el sesgo cognitivo detr谩s del 茅xito de los hor贸scopos. Consiste en la tendencia de las personas a sentirse identificadas con descripciones ambiguas, que pueden encajar con casi cualquier persona.

3. Prejuicio de retrospectiva
Cuando se produce este sesgo, las personas tienden a pensar que cosas que han ocurrido eran m谩s previsibles de lo que eran antes de que ocurrieran.

4. Sesgo del punto ciego
Trata sobre la tendencia de las personas a creer que ellos mismos son menos vulnerables ante los efectos de los sesgos cognitivos que otras personas.

Hay una pelicula que en Argentina se titula Prejuicio Cifrado (titulo original Coded Bias) sobre una estudiante del MIT que trata el tema. Como un caso especial en una conferencia sobre IA aplicada a salud en Argentina mencionaron que todos los datos que tenian para evaluar eran de una poblacion de cierto nivel economico que tenian acceso a instituciones de salud con recursos como para tener sistemas que recolecten informacion, pero la poblacion carenciada, los pueblos originarios y de lugares con baja poblacion que no tenian recursos informaticos son gente no evaluada y con un caso de sesgo (asi fue presentado)

El mayor sesgo que pueden tener las empresas peque帽as es creer que publicar en redes sociales aumentar谩 las ventas.
Trabaje en el 谩rea de publicidad referente a data y literal las empresas se fijaban en el n煤mero de likes y comentarios en los post o perfiles empresariales para determinar que tanto iban a vender. Es dif铆cil borrar ese sesgo de datos hasta que se les explica los KPI鈥檚. Pero la mejor forma es cuando revisan sus ventas y ven que no es lo esperado 馃槙

Existe una paradoja donde a una persona de escasos recursos econ贸micos desea solicitar un pr茅stamo estudiantil para costear su educaci贸n, pero si hay un sesgo en un modelo de ML que eval煤a el riesgo de dar cr茅dito e identifique que esa persona por su situaci贸n no pueda pagarlo entonces esa persona le ser谩 m谩s dif铆cil salir de su situaci贸n si no tiene acceso a un cr茅dito.

Resumen de la clase Bias (Sesgo) y GIGO

Bias

Tiene que ver con la recolecci贸n de datos de forma err贸nea de una muestra en donde no se representa a la totalidad de la poblaci贸n.

En algunos casos como el reconocimiento facial suele haber sesgos en donde no se toman en cuenta todas las personas y sus distintos rasgos.

GIGO (Garbage in / Garbage out)

Si metemos basura en nuestros an谩lisis la conclusi贸n no ser谩 buena y por tanto no obtendremos los resultados esperados. (Debe haber calidad en los datos y estos deben ser de valor seg煤n los requerimientos del proyecto/negocio)

Si les interesa el tema de los sesgos tanto estadisticos como psicologicos les recomiendo el siguiente libro:

El autor es premio novel de economia y es uno de mis libros favoritos, no se arrepentiran de leerlo

Sesgos econ贸micos hay much铆simos y los economistas (soy estudiante de econom铆a), se dan a la tarea de desmenuzarlos y exponerlos por lo que son, uno de los m谩s conocidos es el sesgo de confirmaci贸n.
El sesgo de confirmaci贸n hace que la persona es pos de buscar los resultados que confirmen su idea, solo buscan datos que est茅n de acuerdo con ellos. Gracias al m茅todo cient铆fico, la humanidad ya no es victima de este sesgo tan frecuentemente, de hecho, sigue siendo com煤n hoy en d铆a y en el pasado le paso a muchas personas famosos, por mencionar uno de ellos, Sigmund Freud.

Otros tipos de Sesgos

SESGO DE AFINIDAD
鈥淗a estudiado en la misma universidad que yo鈥. Esta expresi贸n se corresponder铆a con el llamado 鈥淪esgo de afinidad鈥. Es aquel que genera en nosotros/as una predisposici贸n favorable hacia personas con las que compartimos or铆genes o cualidades parecidas a las nuestras.

驴C贸mo nos afecta? Nuestro cerebro percibe a esa persona como 鈥渞econocible鈥 o 鈥渃ercano鈥 y nos resta visi贸n sobre otros aspectos tambi茅n importantes (capacidades, competencias, etc.) El predominio del 鈥淪esgo de afinidad鈥 en los procesos de contrataci贸n puede repercutir en que los equipos de trabajo sean menos diversos y/o creativos.

SESGO CULTURAL
Consiste en la preferencia de un origen cultural sobre otros, que proviene de creencias muy arraigadas sobre roles y estereotipos culturales. Esto nos puede llevar a inclinarnos inconscientemente hacia una persona por su cultura y las cualidades que atribuimos a ella. Frecuentemente, conectamos con m谩s facilidad con las personas de un mismo contexto cultural, porque compartimos constructos y experiencias similares.

La afinidad cultural con una persona puede convertirse en discriminatoria hacia personas de diversos or铆genes, desperdiciando sus talentos y el aporte que otros bagajes culturales ofrecen a la empresa. Este sesgo, tambi茅n puede propiciar el establecimiento y la continuidad de entornos laborales est谩ticos.

EFECTO ANCLAJE
El efecto anclaje se produce cuando los datos que nos ofrece la primera impresi贸n son los 煤nicos que empleamos a la hora de tomar una decisi贸n. Esta informaci贸n nos posiciona, creando un punto de partida que descarta o condiciona el resto de la informaci贸n que conocemos a posteriori sobre ella.

驴Esto en qu茅 se traduce? Uno de los casos frecuentes en los entornos laborales, o procesos de selecci贸n, se produce en relaci贸n con la edad. Por ejemplo, podemos tener tendencia a considerar que personas de edad m谩s avanzada tengan m谩s dificultades de adaptaci贸n a las nuevas exigencias de mercado o a las nuevas tecnolog铆as, restando valor a su experiencia, creatividad y otras competencias que posean, bas谩ndonos en datos de desempleo de mayores de 50 a帽os aportados por un estudio del Banco de Espa帽a.

EFECTO HALO Y EFECTO DIABLO
El efecto halo y el efecto diablo est谩n relacionados con los sesgos de afinidad y de confirmaci贸n. Estos efectos nos ocurren cuando nos centramos exclusivamente en una cualidad especialmente positiva (efecto halo) o negativa (efecto diablo) de una persona. Esta cualidad se convierte pr谩cticamente en la 煤nica referencia desde la que la percibimos.

驴C贸mo afecta a los entornos laborales? Los efectos halo y diablo distorsionan otras facetas de las personas, que tendemos a comparar con aquella cualidad que nos ha llamado la atenci贸n.

El efecto halo tiende a generar altas expectativas y predisposici贸n al 茅xito. Por otro lado, en el efecto diablo se invierte la tendencia: se espera el fracaso y las expectativas disminuyen. En ambos casos, se emiten juicios de valor e incluso discriminatorios con base en s贸lo una cualidad y no valorando otras dimensiones, competencias y capacidades.

Cherry Picking 馃崚

Existe el denominado Cherry Picking, 茅ste se basa en la falacia de evidencia incompleta o, en otras palabras, es tomar en cuenta para nuestro estudio solo la informaci贸n que confirme nuestro estudio o lo que queremos demostrar.
Aunque puede suceder que se haga consciente o inconscientemente.

corazoncito si eres de Colombia y te emocionaste cuando Silvia mencion贸 a Medell铆n

-Sesgo de disponibilidad: tomar decisiones s贸lo con la informaci贸n disponible en nuestra base de datos sin enriquecerla.
-Sesgo de confirmaci贸n: interpretar una informaci贸n de tal manera que se vuela compatible con nuestras creencias.

Coded Bias es un documental en Netflix que justamente refleja como los sesgos pueden repercutir directamente en los resultados de los algoritmos de la IA cuando no tenemos una muestra significativa. Impactante como el reconocimiento facial tenia menos exactitud con personas de piel oscura respecto a piel clara y como esto llevo a un estudio generalizado de casos donde el sesgo repercut铆a en resultados diversos como selecci贸n de personal, seguridad nacional, salud. Verdaderamente esto no se puede tomar a la ligera y tenemos que ser responsables y 茅ticos al querer iniciar trabajos en este mundo. Agradezco a Platzi por este contenido que hasta ahora me era desconocido.

Aqu铆 el v铆deo viral que ejemplifica el sesgo que nos comentaba la profesora, en el que para crear y probar tecnolog铆a se usan sujetos blancos.
https://www.youtube.com/shorts/87QwWpzVy7I

En el estudio:
De ratones y ratonas: un sesgo metodol贸gico peligroso
Leandro Giri y Federico Bernab茅 Blach analizan un sesgo metodol贸gico en la investigaci贸n en ciencias de la vida sobre la selecci贸n de espec铆menes para modelado a partir de animales.
Se trata de un sesgo sexual ubicuo, y consiste en el uso abrumadoramente mayoritario de espec铆menes macho para modelar seres humanos, tanto hombres como mujeres.
En este estudio se analiza el motivo de este sesgo y se revela una serie de problemas sociales y tecnol贸gicos derivados del uso de conocimiento cient铆fico inv谩lido obtenido a partir de investigaciones efectuadas mediante la pr谩ctica sesgada.
Aqu铆 la liga al estudio:

(https://repositorio.uca.edu.ar/bitstream/123456789/5642/1/de-ratones-ratonas-sesgo-metodologico.pdf)

RETO DE LA CLASE
Sesgo de selecci贸n
Este es un tipo de sesgo en el que hay un error en la selecci贸n de elementos de la poblaci贸n de datos. Por ejemplo, si se planea establecer la estatura promedio de personas espa帽olas, pero los datos se recogen de una muestra desequilibrada. En este caso, el sesgo de selecci贸n ser铆a ir a coger jugadores de baloncesto esperando que sean una muestra representativa de la altura espa帽ola, cuando es evidente que no ser铆a asertivo.

En definitiva, este sesgo es un error sistem谩tico que no depende del azar, por lo que es necesario identificarlo y tratar de neutraliza su efecto.

Sesgo del superviviente
El sesgo del superviviente es uno de los tipos de sesgo en estad铆stica Big Data que se encuentra dentro del sesgo de selecci贸n, es decir, tambi茅n hace referencia a un error sistem谩tico.

Este tipo de sesgo se produce ya que muchas veces los datos que se disponen no representan una parte fiable de la poblaci贸n que se quiera medir, sino una parte de aquellos que han superado ciertos filtros.

Como, por ejemplo, pretender estudiar cu谩l es el alcance acad茅mico de una provincia con base a los estudiantes que ya han superado una gran de pruebas acad茅micas, sin considerar la poblaci贸n que no ha podido acceder a ning煤n nivel de educaci贸n.

Sesgo por omisi贸n de variable
Este sesgo en estad铆stica Big Data ocurre cuando se crea un modelo incorrecto porque no se han tenido en cuenta las variables m谩s importantes.

Por ejemplo: considerar la brecha de g茅nero presentada en el salario.
Un estudio llevado a cabo en 2007 en EEUU por el departamento de trabajo, calcul贸 que la brecha de g茅nero respecto al salario entre hombres y mujeres era de un 20.4%. Es decir, las mujeres en media ganan un 20.4% menos que los hombres. Pero si tenemos en cuenta variables ocultas como: interrupci贸n de la carrera profesional, edad, n煤mero de hijos, estudios鈥 En ese caso, la brecha de g茅nero podr铆a estar entre el 4.8% y el 7.1%.

En mi trabajo anterior como Gerente de Inteligencia comercial, se cayo en un sesgo que casi quiebra a la empresa. Para realizar la planeaci贸n de compras, se tomaba el hist贸rico de ventas que le hac铆amos a los principales clientes. Esto durante cuatro a帽os hizo que triplicaramos las ventas. Porque siempre hab铆a material disponible del que mas se vendia.

Sin embargo, en 2021 la hija del due帽o tomo la direcci贸n comercial de la compa帽铆a, y para la palneaci贸n de compras, desde su punto de vista, no se hac铆a de la manera correcta, y decidi贸 que ahora el cliente seria el que nos dir铆a que vamos a comprar.

Si se ve de manera objetiva esto no es malo, lo malo fue el sesgo que se creo, al solo preguntarle a las 3 gerentes de compras de los 3 principales clientes, en vez de preguntarle al equipo de ventas de los principales clientes.

Este sesgo provoco que no se tuviera certeza del mercado, se compraron productos que estaban saliendo de tendencia a sobrestock, y los productos en auge se liquidaron.

Llego un momento en el que de tener siempre mes y medio de stock de los productos de alta rotaci贸n, el stock paso a 9 meses de algunos productos y a cero en otros.

En Datos econ贸micos de los pa铆ses creo que hay muchos sesgos, a veces no son buenas investigaciones y otras publican datos manipulados para no mostrar la verdadera realidad de una econom铆a.

El concepto de 鈥渂ias鈥 o sesgo y la expresi贸n 鈥淕arbage in, Garbage out鈥 (GIGO) son fundamentales en el 谩mbito de la ciencia de datos y la toma de decisiones basadas en datos. Aqu铆 se explica en detalle cada uno de estos conceptos:

Bias o Sesgo:
El sesgo se refiere a la distorsi贸n sistem谩tica en una muestra de datos que causa que los resultados no sean representativos de la poblaci贸n de inter茅s. En otras palabras, cuando se selecciona una muestra que no es estad铆sticamente significativa o que no refleja adecuadamente la poblaci贸n en estudio, se introduce un sesgo en los resultados. Algunos puntos clave sobre el sesgo incluyen:

El sesgo puede surgir por diversas razones, como una selecci贸n inadecuada de la muestra, sesgos de respuesta en encuestas, o factores culturales y sociales.

Es esencial evitar el sesgo en la recopilaci贸n de datos para que los resultados sean confiables y generalizables a la poblaci贸n en su conjunto.

En el ejemplo de Medell铆n, la muestra de 100 personas seleccionadas no refleja la proporci贸n real de hombres y mujeres en la poblaci贸n, lo que introduce un sesgo en los resultados.

El sesgo puede afectar la calidad de los an谩lisis y las decisiones basadas en datos, por lo que es importante minimizarlo o corregirlo cuando sea posible.

Garbage in, Garbage out (GIGO):
La expresi贸n 鈥淕arbage in, Garbage out鈥 (basura entra, basura sale) se refiere al principio de que la calidad de los resultados (output) de un proceso depende de la calidad de la entrada (input). En el contexto de la ciencia de datos y el an谩lisis de datos, esto significa que si los datos de entrada no son precisos, confiables o representativos, los resultados y conclusiones que se obtengan ser谩n igualmente deficientes o poco confiables. Algunos aspectos importantes relacionados con GIGO incluyen:

Los datos de baja calidad, incorrectos o incompletos pueden conducir a an谩lisis err贸neos y decisiones incorrectas.

Es crucial garantizar que los datos de entrada sean precisos, est茅n bien estructurados y sean representativos de la poblaci贸n o fen贸meno que se est谩 estudiando.

La limpieza y preprocesamiento de datos son etapas cr铆ticas en la ciencia de datos que buscan garantizar que los datos de entrada sean confiables y adecuados para el an谩lisis.

La calidad de los datos es esencial en aplicaciones de aprendizaje autom谩tico y modelos predictivos, ya que los modelos solo pueden aprender de la informaci贸n que se les proporciona.

En resumen, tanto el sesgo como el principio GIGO subrayan la importancia de la calidad y representatividad de los datos en cualquier an谩lisis o proceso que involucre el uso de datos. La toma de decisiones basadas en datos s贸lidos y la obtenci贸n de resultados confiables dependen en gran medida de la calidad de los datos de entrada y la minimizaci贸n de sesgos.

Dentro de lo que he leido, otros tipos de sesgos que me parecen interesantes son los siguientes:
-Sesgo de confirmaci贸n: Se espera que el resultado de la informaci贸n est茅 acorde a nuestros conocimientos y se minimizan o ignoran aquelos datos que son opuestos.

-Sesgo de selecci贸n: Va relacionado con la inadeculada selelcci贸n de la muestra de an谩lisis. Sea por convenencia, criterio o error la muestra no representa la poblaci贸n y los resultados obtenidos no muestran la realidad.

-Sesgo de precipitaci贸n: Cuando se quiere dar un respuesta r谩pida para tomar una desici贸n, hace no se profundize se analicen datos limitados dejando por fuera informaci贸n representativa.

-Sesgo de disponibilidad: En este caso se tiene en cuenta los datos mas disponibles, de mayor facilidad de acceso y no se profundiza para obtener una mejor muestra con un panorama general.

-Sesgo de anclaje: Ocurre cuando no se esta familiarizado con el tema, para esto hay que detenerse, reflexionar, formular las preguntas necesarias para conocer el tema o area de investigaci贸n.

Las definiciones compartidas fueron tomadas como referencia de la siguiente p谩gina: https://tudashboard.com/sesgo-en-el-analisis-de-datos/

Existe un sesgo en el sistema de cr茅dito financiero, es: Si no est谩s bancarizado quiere decir que no tienes dinero para pagar un pr茅stamos o una tarjeta de cr茅dito. Hay gente que simplemente le gusta manejar el efectivo y nunca se ha interesado por ese tipo de entidades.

El sesgo del optimismo

El sesgo del exceso de optimismo transforma esa cualidad positiva en incapacidad para medir el riesgo. Se parece al de exceso de seguridad: la tendencia a sobrevalorar nuestras capacidades, intuiciones o conocimientos y por tanto a infravalorar las de los dem谩s. Puede conducir a la ilusi贸n de control o a exagerar nuestra influencia real en los resultados. Esa tendencia recuerda al efecto Dunning-Kruger, que nos ense帽a que las personas con menos habilidades y conocimientos tienden a sobrestimar sus capacidades.

Otro ejemplo en el que las empresas podr铆an estar incurriendo es en los sesgos tienen que ver con los estereotipos de g茅nero y lo que se asume de cada uno, en el curso de Diversidad e inclusi贸n para empresas (recomendado), la profe nos pon铆a el ejemplo de un Banco que cre贸 un producto dirigido a mujeres llamado Banca Cristal, en el que decoraban las sucursales del banco de rosado y promov铆an la compra de productos de belleza, hogar, maternidad, etc. y esto resulto en p茅rdidas de m谩s de seis millones de d贸lares.

En las entidades del gobierno siempre suele tener sesgos, al tomas candidatos sin tener en cuentas sus capacidades y aprendizaje y solo por tener en cuenta que es de la familia amigos y dem谩s no por sus competencias

El sesgo algor铆tmico es uno de los mayores riesgos porque compromete y pone en duda la totalidad del prop贸sito del Machine Learning. Este sesgo, a menudo pasado por alto, puede conducir a errores costosos y, de no controlarse de manera adecuada, puede llevar a proyectos y organizaciones enteras a tomar decisiones en direcciones err贸neas, independientemente del paradigma en el que nuestras herramientas se hayan desarrollado.

Sesgo de Confirmaci贸n
A menudo las organizaciones y personas iniciamos una investigaci贸n a partir de una idea o hipotesis que queremos validar. Cuando esto ocurre es normal caer en un tipo sesgo que consiste en recopilar informaci贸n selectiva que permita validar dicha idea, descartando o ignorando aquella informaci贸n que la refute.

Mas que sesgos pienso que es el uso errado o mal interpretado de la informaci贸n obtenida

Uno de los sesgos que tienen las empresas hoy es la oportunidad, la calidad y el est谩ndar de la informaci贸n financiera. Las actuales herramientas utilizadas en los procesos de registro de informaci贸n financiera (contabilidad), aunque son muy potentes, son subutilizados o usado de forma incorrecta y no se logra entender de forma objetiva la mejor forma de aprovecharlos.

Constantemente distintas entidades se tienen que enfrentar a una baja calidad de la informaci贸n financiera, en especial en PYMES, quienes ante distintas situaciones y retos que trae el emprendimiento ponderan muy por debajo el beneficio de contar con informaci贸n de valor que entrega resultados relevantes y terminan desacreditando las capacidades de las fuentes de informaci贸n como las que estamos mencionando.

La soluci贸n a todo este problema es la simplicidad. Se debe hacer simple hasta el punto en que cualquiera lo pueda usar y entender y que a partir de all铆 encuentren el real valor de la informaci贸n.

驴Qu茅 otros tipos de sesgos incurren en la empresas o el sector p煤blico? * En el lenguaje humano cotidiano donde los modelos de lenguaje pueden aprender y reflejar los prejuicios presentes en el lenguaje cotidiano como estereotipos culturales on ling眉isticos que perpetuan sesgos y discriminaci贸n. * Sesgos en las decisiones automatizadas en el an谩lisis de textos como por ejemplo en la selecci贸n de un CV o sistema de evaluaci贸n de riesgos financieros. * Falta de representaci贸n diversa si la informaci贸n tomada no representa la diversidad de perspectivas y experiencias humanas, el modelo puede tener dificultades para comprender y procesar de manera justa los datos.
LA CALIDAD DEL RESULTADO (OUTPUT) DEPENDE DE LA CALIDAD DE LA ENTRADA (INPUT). NECESITAMOS ASEGURARNOS EN : * LA CALIDAD DE LOS DATOS * FUENTE DE ACCESO * CANTIDAD DE DATOS * COMO TIPOLOGIA DE DATOS PARA QUE EL RESULTADO SEA DE CALIDAD
Sesgo de enmarque: Que basado en la informaci贸n presentada, te determina que la mejor decisi贸n es la indicada. Por ejemplo, cuando vas a comprar en Prime Day de Amazon, te indica el valor original tachado y abajo el valor que comprar铆as en descuento, esto para que creas que es una oferta la que te llevas, cuando no necesariamente es el caso.
Sesgos en estad铆sticas. Les dejo el link para mayor detalle. Incluye el caso del chatbot lanzado por Microsoft en 2016 que usaba tecnolog铆a de IA para crear contenido y publicarlo en Twitter, que despu茅s de un tiempo comenz贸 a realizar comentarios de naturaleza discriminatoria. <https://mailchimp.com/es/resources/data-bias-causes-effects/> ![](https://static.platzi.com/media/user_upload/image-3e765aee-b0e6-48ce-82a9-5f130776bf5b.jpg)![]()
EN la pelicula Elysium el sistema de salud estaba totalmente sesgado, pues solo curaba a los habitantes de Elysium y solo cuando cambiaron su programacion e incluyeron a todos los habitantes de la tierrra el sistema se libero y empezo a curar a todos sin ning煤n Sesgo <https://www.youtube.com/watch?v=vSAS79fBVxs>
## Ser influencer. Este es el sesgo m谩s frecuente que he notado en la poblaci贸n latina. Creer que por hacer bailes en TikTok uno consigue una forma de vivir, sin considerar el trabajo pesado que en realidad es ser un creador. Dejo el ignite de la 煤ltima conferencia de Platzi que se dio en Bog贸ta <https://platzi.com/new-home/clases/8220-platziconf2023bog/65430-ignite-sebastian-sarmiento/>
Hablemos de instituciones o universidades, espec铆ficamente cuando un estudiante quiere su t铆tulo universitario, al menos en mi pa铆s, para obtenerlo necesitamos 3 cosas, de las cuales una es vinculaci贸n con la sociedad, y es que aqu铆 es un problema porque solo te la otorgan dependiendo de tu nivel y si tu nivel no es apto no te la dan. Este proceso de hace en base a algoritmos... y lo ir贸nico es que un estudiante de menor nivel la dan y a uno mayor no..
**Sesgo de estatus:** Puede ocurrir cuando se da un trato preferencial a personas con un estatus o posici贸n jer谩rquica superior en la organizaci贸n, lo que puede llevar a decisiones sesgadas en beneficio de ciertos individuos o grupos.

Considero que otro tipo de bias (sesgos) que tienen suceden en las empresas es la baja tasa de informacion de gusto. Ejemplo al crear facebook no se basan en mostrarte la informacion que te gusta, sino la informacion que ellos consideran por tu edad ingresada al registro

Algunos sesgos en los que incurren las empresas:


.

  1. Sesgos algor铆tmicos
    Si las empresas utilizan algoritmos de inteligencia artificial o aprendizaje autom谩tico para tomar decisiones, estos algoritmos pueden verse afectados por sesgos inherentes en los datos de entrenamiento o en el dise帽o del algoritmo. Esto puede llevar a resultados discriminatorios o injustos, especialmente en 谩reas como la selecci贸n de personal, la concesi贸n de pr茅stamos o la toma de decisiones legales.
    .
  2. Sesgos de disponibilidad
    En vez de buscar datos de una amplia gama de fuentes, hay empresas que optan por seleccionar los datos provenientes de fuentes f谩ciles de acceder pero que no aportan variedad y amplitud al muestreo y recolecci贸n de datos.
    .
  3. Sesgo de confirmaci贸n
    Las empresas pueden tener una tendencia a buscar o interpretar datos de manera selectiva para confirmar sus creencias preexistentes o hip贸tesis, mientras ignoran o descartan informaci贸n que contradiga esas creencias. Esto puede llevar a una visi贸n sesgada y a decisiones basadas en suposiciones incorrectas.

Al aparecer siempre va a ver un sesgo as铆 sea m铆nimo.

Creo que el principal sesgo que se debe atacar es que las empresas no reconozcan o subestimen la importancia de los sesgos en el an谩lisis de datos. Los gobiernos y las empresas podr铆an no reconocer potenciales sesgos y obtener resultados errados.

Lo segundo a tener en cuenta es contar con datos incompletos cuando se realicen an谩lisis, por ejemplo, si un gobierno necesita atacar el desempleo y toma decisiones en base a datos incompletos o no representativos, podr铆a resultas en decisiones ineficaces.

Tambi茅n se deben seleccionar los datos de forma aleatoria y no de manera selectiva, si una compa帽铆a s贸lo analiza a sus usuarios que est茅n m谩s felices con sus productos, podr铆a subestimar el desencanto real de sus clientes.

Sesgo de variable omitida
La falta de una variable afecta a la legitimidad de la estad铆stica. Por ejemplo, un estudio sobre coches que no incluya el a帽o o el kilometraje puede proporcionar resultados inexactos.

Al mirar datos, aseg煤rate de que tengan en cuenta todas las variables relevantes.

Sesgo de financiacion
Hace referencia a la probabilidad de que un estudio favorezca a la persona que lo financi贸.

El sesgo de financiaci贸n es especialmente popular en las comparaciones de productos. Si Bounty paga una comparaci贸n de papel de cocina, es mucho m谩s probable que esa comparaci贸n favorezca a Bounty que a otra marca.

tipo de sesgo que se me ocurre en este momento, ya que estamos en elecciones en argentina, es las predicciones de encuestadoras privadas que hace muchos a帽os vienen con pron贸sticos errados, ya que la encuestas dependen mucho de la zona donde se toma, por que aqu铆 todav铆a hay mucho fanatismo partidario por zona, entonces si los encuestados son solo de una misma zona el restado es err贸neo

Otro tipo de sesgo es cuando desde el inicio no f贸rmulas bien el objetivo de tu an谩lisis y est谩 basado m谩s en tu opini贸n que en un objetivo independiente de lo q creas.

Sesgo de codificaci贸n: Este tipo de sesgo ocurre cuando los datos se codifican de manera inexacta o sesgada. Por ejemplo, si una empresa codifica la edad de sus clientes como 鈥18-24鈥, pero algunos clientes tienen m谩s de 24 a帽os, los datos pueden estar sesgados hacia los clientes m谩s j贸venes.

Sesgo algoritmico: Cuando en un modelo de inteligencia artificial se favorecen ciertas caracter铆sticas o patrones. Sesgo de confirmaci贸n: Cuando solo se busca evidencia que confirme nuestras hip贸tesis y suposiciones previas y descartamos informaci贸n contradictoriad aunque pueda ser verdadera.

promediar el IQ de las personas cuando no todas las personas se someten a examenes de IQ

Gracias

Adem谩s de los sesgos y el problema de GIGO (Garbage In, Garbage Out), que se refiere a la idea de que si los datos de entrada son de mala calidad o incorrectos, los resultados y las conclusiones tambi茅n ser谩n poco confiables, existen otros problemas y desaf铆os asociados con los datos. Algunos de ellos incluyen:

  1. Falta de representatividad: Los datos pueden no ser representativos de la poblaci贸n o fen贸meno que se est谩 estudiando, lo que puede conducir a conclusiones inexactas o sesgadas. Esto puede ocurrir si los datos se obtienen de una muestra no representativa o si ciertos grupos o caracter铆sticas est谩n subrepresentados en los datos.

  2. Falta de integridad y exactitud: Los datos pueden contener errores, valores at铆picos o informaci贸n incompleta. Esto puede afectar la calidad y confiabilidad de los an谩lisis y resultados derivados de esos datos.

  3. Sesgo de selecci贸n: El sesgo de selecci贸n ocurre cuando hay una selecci贸n no aleatoria de datos, lo que puede distorsionar los resultados. Por ejemplo, si se excluyen ciertos grupos o variables de inter茅s en el proceso de selecci贸n de datos, se puede generar un sesgo en los resultados.

  4. Sesgo de respuesta: El sesgo de respuesta ocurre en las encuestas o estudios de opini贸n cuando las personas seleccionadas para participar no responden de manera representativa o cuando hay sesgos en las respuestas proporcionadas. Esto puede conducir a una distorsi贸n en los resultados y conclusiones basadas en esos datos.

  5. Sesgo temporal: El sesgo temporal se refiere a la falta de representatividad de los datos a lo largo del tiempo. Los cambios en las circunstancias, el contexto o las condiciones pueden hacer que los datos antiguos no sean aplicables o relevantes en el presente.

  6. Sesgo de confirmaci贸n: El sesgo de confirmaci贸n ocurre cuando se busca, interpreta o se da m谩s peso a la informaci贸n que respalda las creencias o hip贸tesis preexistentes, mientras que se pasa por alto o se descarta la informaci贸n que no las respalda. Esto puede llevar a conclusiones err贸neas o parciales basadas en datos limitados.

  7. Sesgo de muestreo: El sesgo de muestreo se produce cuando la selecci贸n de la muestra no es aleatoria o cuando ciertos grupos o caracter铆sticas tienen m谩s probabilidad de ser seleccionados. Esto puede introducir sesgos sistem谩ticos en los resultados del an谩lisis.

Estos son solo algunos ejemplos de problemas y desaf铆os asociados con los datos. Es importante tener en cuenta estos factores al realizar an谩lisis y sacar conclusiones basadas en datos, y aplicar t茅cnicas adecuadas de manejo y an谩lisis de datos para mitigar estos sesgos y garantizar resultados m谩s precisos y confiables.

驴Podr铆a ser este? Leo sus opiniones

Efecto halo y Efecto diablo

El efecto halo y el efecto diablo est谩n relacionados con los sesgos de afinidad y de confirmaci贸n. Estos efectos nos ocurren cuando nos centramos exclusivamente en una cualidad especialmente positiva (efecto halo) o negativa (efecto diablo) de una persona. Esta cualidad se convierte pr谩cticamente en la 煤nica referencia desde la que la percibimos.

驴C贸mo se aplicar铆a esto en una empresa?
La empresa, a pesar de haber hecho ya un an谩lisis previo da datos sobre sus clientes, se da cuenta de que la recolecci贸n que hizo no fue suficiente para poder tomar una decisi贸n, sin embargo, ya no hay tiempo para hacer otra recolecci贸n y repetir el proceso, por lo que en base a esos pocos datos empieza a tomar decisiones.

Aqu铆 puede existir un sesgo debido a que solo se basan en algunas caracter铆sticas de las personas y no en caracter铆sticas generales.

  • Sesgo de selecci贸n: Ocurre cuando los datos utilizados para el an谩lisis est谩n sesgados debido a la forma en que se recopilaron o seleccionaron. Esto puede conducir a conclusiones incorrectas o inexactas si no se tiene en cuenta el sesgo en la muestra de datos.

  • Sesgo temporal: Ocurre cuando los datos analizados se ven afectados por cambios en el tiempo.

  • Sesgo cultural o geogr谩fico: Ocurre cuando los datos analizados se ven afectados por diferencias culturales o geogr谩ficas que pueden influir en los resultados.

El sesgo de supervivencia siempre me ha llamado mucho la atenci贸n. Es aquel en el que nos enfocamos en los resultados positivos y descartamos los fallos, pudiendo estos 煤ltimos ense帽arnos m谩s que los primeros. En una empresa podr铆a pasarle al enfocarse en aprender sobre sus consumidores en base a sus productos exitosos m谩s que en los que no tuvieron 茅xtio.

Sesgo de supervivencia: En algunos casos, las empresas pueden basar sus an谩lisis de datos 煤nicamente en los datos disponibles de aquellos que han continuado utilizando sus servicios o productos, excluyendo a aquellos que dejaron de ser clientes. Esto puede llevar a conclusiones sesgadas sobre la satisfacci贸n del cliente o el 茅xito del negocio.

Sesgos. A nivel de las organizaciones encontramos varios casos de sesgos que en ocasiones pueden limitar el manejo de datos y que no permiten llegar a impactar grandes grupos de personas. Ejemplos:

  • Temas de 铆ndole racial
  • Niveles de pobreza
  • Factores regionales o culturales
  • Ideolog铆a de g茅nero
  •   Criterios personales en lugar de criterios univelsales
    

Estos ejemplos hacen que en ciertas organizaciones, por alguno de estos t贸picos limiten los dados en su recolecci贸n, tratamiento y posterior entrega para consumo. En conclusi贸n, aplicando estos sesos la informaci贸n que se obtiene es parcial y no general para una analisis completo.

Cuando en marketing no se calculan bien los muestreos dentro del universo a analizar se produce un bias super grande, por otro lado, cuando se optimizan algoritmos de machine learning para la detecci贸n de c谩ncer y no se divide bien la base inicial de datos para el muestreo, experimentaci贸n y luego la validaci贸n

podria ser por ejemplo cuando se generaliza las personas por el mes en que nace y se piensa que todos los nacidos en noviembre son igual

Otros tipos de sesgos:
Sesgo de confirmaci贸n: se produce cuando los datos recopilados o analizados se utilizan para confirmar una hip贸tesis preconcebida, en lugar de buscar la verdad objetiva.
Sesgo de supervivencia: se produce cuando los datos utilizados s贸lo contienen informaci贸n de los sujetos o elementos que han sobrevivido a un proceso o evento, ignorando la informaci贸n de aquellos que no sobrevivieron.
Sesgo de memoria: se produce cuando los sujetos o encuestados no recuerdan o no reportan informaci贸n precisa sobre eventos o situaciones pasadas.
Sesgo de respuesta socialmente deseable: se produce cuando los sujetos o encuestados dan respuestas que creen que son socialmente aceptables o deseables, en lugar de respuestas verdaderas y honestas.
Sesgo de atribuci贸n: se produce cuando se atribuyen causas incorrectas a los resultados o eventos observados.
Sesgo de punto de referencia: se produce cuando se utiliza un punto de referencia inapropiado o incorrecto en el an谩lisis de los resultados.
Sesgo de confirmaci贸n de la hip贸tesis nula: se produce cuando se acepta la hip贸tesis nula sin una evaluaci贸n cuidadosa, lo que lleva a la interpretaci贸n err贸nea de los resultados.

Los principales tipos de sesgo de informaci贸n son el sesgo de clasificaci贸n err贸nea, el sesgo de recuerdo, el sesgo del entrevistador, el sesgo de respuesta, el sesgo de reporte, el sesgo del observador, el sesgo de comprobaci贸n y el sesgo de confirmaci贸n

Un sesgo que he visto es pensar que por pagar publicidad en RRSS (redes sociales) vas a hacer que nuevos clientes te pongan en la mira, cuando no necesariamente se da as铆, esto debido a que depende tu mercado el que haya potenciales clientes all铆.
Por ejemplo; a una peque帽a tienda de ropa que hace delivery le es mucho m谩s rentable pagar por posicionamiento que una empresa que vende maquinaria industrial.

Otras clases de sesgos:

a) Sesgos de selecci贸n. Se presentan cuando no est谩n definidos de forma clara los criterios de selecci贸n de quienes vayan a participar en una investigaci贸n

b) Sesgos de informaci贸n o ejecuci贸n. Se presenta, luego de que se ha seleccionado al o los participantes, y la calidad de la informaci贸n y/o datos recolectados, los cuales no se pueden estandarizar.

c) Sesgos de confusi贸n: Estos sesgos se presentan durante el an谩lisis e interpretaci贸n de los datos, ya que se puede llegar a inferencias err贸neas o espurias.

驴Qu茅 tipos de sesgos inconscientes podemos encontrarnos en nuestro d铆a a d铆a en la oficina?
Para ser capaces de identificarlos, a continuaci贸n dejamos cinco de los m谩s comunes, aunque habr铆a much铆simos m谩s:

1. Sesgo de afinidad: 鈥溌s de mi pueblo!鈥. El sesgo de afinidad es aquel por el que cuando te presentan a una persona con creencias, aficiones o procedencia similares a las nuestras la consideras de partida mejor que a cualquier otra persona. Es decir, cuando evaluamos de mejor manera a aquellas personas que son similares o afines a nosotros.

2. Sesgo de confirmaci贸n: 鈥溌o sab铆a!鈥. El sesgo de confirmaci贸n o 鈥減rofec铆a autocumplida鈥 ocurre cuando s贸lo tenemos en cuenta aquella informaci贸n respecto a una persona que confirma la idea preconcebida que tenemos de ella. El resto de informaci贸n que la contradice, la ignoramos.

3.Efecto anclaje: 鈥溌o viste adecuadamente, no es profesional!鈥 El sesgo o efecto anclaje se da cuando usamos la informaci贸n inicial de una persona o s贸lo aquella de la que disponemos, para emitir juicios posteriores.

4. Sesgo de aversi贸n a la p茅rdida: 鈥溌緾贸mo vamos a arriesgarnos a eso?鈥. Cuantos m谩s recursos inviertes en un proyecto, m谩s te atas a 茅l emocionalmente y m谩s te cuesta abandonarlo. El miedo a la incertidumbre tambi茅n propicia este sesgo, que es la tendencia a rechazar lo nuevo y los cambios en general sobre lo ya establecido, lo que propicia entornos laborales fosilizados.

5. Meta-sesgo: 鈥溌o no tengo sesgos!鈥. Se trata de la tendencia a no darse cuenta de los propios sesgos cognitivos y de verse como menos sesgado que los dem谩s.

https://fundacionadecco.org/azimut/los-principales-sesgos-inconscientes-en-el-entorno-laboral-y-como-trabajarlos/

Evitar estos fen贸menos en an谩lisis de datos

Tratar de que los n煤meros sean suficientemente grandes.

Asegurar que la representaci贸n sea ecu谩nime.

Garbage in, garbage out

La calidad del resultado (output) depende de la calidad de la entrada (input).

Sesgo de confirmaci贸n, disponibilidad, observador, de atribuci贸n, de memoria.

  1. Sesgo de confirmaci贸n: este tipo de sesgo ocurre cuando se seleccionan o interpretan datos de manera que confirmen las creencias o hip贸tesis preconcebidas, en lugar de considerar la evidencia en su totalidad. Por ejemplo, una empresa puede seleccionar solo aquellos datos que respalden su producto o idea, en lugar de considerar todos los datos disponibles.
  2. Sesgo de selecci贸n de muestra: este sesgo ocurre cuando se selecciona una muestra que no es representativa de la poblaci贸n completa. Esto puede suceder por diversas razones, como la falta de acceso a ciertos grupos o la selecci贸n de una muestra que es demasiado peque帽a o sesgada para representar adecuadamente a la poblaci贸n completa.
  3. Sesgo de supervivencia: este sesgo ocurre cuando se basan los an谩lisis solo en los datos disponibles y se ignoran los datos que faltan. Por ejemplo, una empresa puede realizar un an谩lisis de datos sobre los clientes que han comprado sus productos, pero ignorar a aquellos clientes que no han comprado.
  4. Sesgo de atribuci贸n: este sesgo ocurre cuando se atribuyen causas a los resultados de un an谩lisis de datos sin considerar otros factores relevantes. Por ejemplo, una empresa puede atribuir un aumento en las ventas a una nueva campa帽a publicitaria, sin considerar otros factores que tambi茅n podr铆an haber contribuido al aumento.
  5. Error de medici贸n: este error ocurre cuando se miden los datos de manera incorrecta o imprecisa, lo que puede afectar la calidad de los an谩lisis posteriores. Por ejemplo, una empresa puede medir la satisfacci贸n del cliente utilizando una escala de calificaci贸n que no es clara o que no mide lo que realmente importa para los clientes.

De acuerdo a los tipos de Sesgos, considero que puede incurrir en una basta mayor铆a, acorde al tipo de decisi贸n o evaluaci贸n que se est茅 realizando en la empresa. Como por ejemplo, el sesgo de anclaje, ya que en las empresas en ocasiones sucede que se toman decisiones basado en la primera informaci贸n que se obtiene, esto partiendo de unos supuestos o anclajes, con los cuales se har谩 ajustes para lograr tener una estimaci贸n.
El sesgo de confirmaci贸n, donde las empresas se centran en buscar, interpretar, validar la informaci贸n que favorece los planteamientos o hip贸tesis que se tienen, y dando una menor importancia a lo contradictorio. Lo cual puede llevar a productos que no favorecen a la poblaci贸n tanto como se pensaba, o que incluso pueden causar efectos negativos importantes que no se tuvieron en cuenta

Otros tipos de sesgos

Adem谩s de los sesgos y errores que mencionamos anteriormente (bias y GIGO), existen otros tipos de sesgos y errores que pueden ocurrir en la recolecci贸n y an谩lisis de datos. Algunos de ellos son:

  1. Sesgos de selecci贸n: Ocurren cuando los datos recopilados no representan adecuadamente la poblaci贸n objetivo. Esto puede deberse a que las muestras se seleccionan de manera sesgada o a que se omiten ciertos grupos de la poblaci贸n en la recolecci贸n de datos.
  2. Sesgos de respuesta: Ocurren cuando las respuestas de los encuestados est谩n sesgadas debido a la forma en que se formulan las preguntas o a las opciones de respuesta proporcionadas.
  3. Sesgos de confirmaci贸n: Ocurren cuando se buscan activamente datos que confirmen una hip贸tesis preconcebida, en lugar de buscar datos que puedan refutarla.
  4. Sesgos culturales: Ocurren cuando los valores y creencias de una cultura influyen en la recopilaci贸n y an谩lisis de datos, lo que puede llevar a interpretaciones incorrectas.
  5. Errores de medici贸n: Ocurren cuando los datos recopilados no miden con precisi贸n lo que se pretend铆a medir, debido a errores en la formulaci贸n de preguntas, en la codificaci贸n de las respuestas o en la interpretaci贸n de los datos.
  6. Errores de procesamiento: Ocurren cuando se cometen errores en la manipulaci贸n y an谩lisis de los datos, por ejemplo, debido a errores en la programaci贸n de los algoritmos utilizados para el an谩lisis.

Es importante que las empresas y el sector p煤blico sean conscientes de estos sesgos y errores para tratar de minimizarlos y mejorar la calidad de los datos utilizados en la toma de decisiones.

La importancia de evitar el bias y GIGO en la recolecci贸n y uso de datos

Es importante que las empresas y organizaciones que recolectan y utilizan datos tomen en cuenta dos conceptos fundamentales: el bias y el GIGO (garbage in, garbage out).

El bias se refiere a la tendencia de los datos a estar sesgados hacia ciertos grupos o perspectivas. Esto puede ocurrir debido a factores como la falta de diversidad en los equipos de recolecci贸n de datos, la falta de representaci贸n de ciertos grupos en la muestra de datos, o la manipulaci贸n intencional de los datos para respaldar ciertas agendas.

El bias puede llevar a decisiones injustas o incorrectas que afectan a individuos o grupos enteros, por lo que es importante tomar medidas para evitarlo. Esto puede incluir la creaci贸n de equipos de recolecci贸n de datos m谩s diversos, la inclusi贸n de una mayor variedad de perspectivas en la muestra de datos, o la verificaci贸n constante de los datos para detectar posibles sesgos.

El GIGO, por otro lado, se refiere a la idea de que los datos incorrectos o incompletos que se ingresan en un sistema de an谩lisis pueden llevar a resultados inexactos o in煤tiles. Esto puede ser el resultado de errores humanos, problemas con los dispositivos de recolecci贸n de datos, o incluso problemas con el software de an谩lisis utilizado.

El GIGO es problem谩tico porque puede llevar a decisiones incorrectas o ineficaces que pueden tener graves consecuencias. Es importante asegurarse de que los datos ingresados en un sistema de an谩lisis sean precisos y completos, y de realizar controles de calidad regulares para garantizar que los datos sean lo m谩s precisos posible.

En general, es importante tener en cuenta tanto el bias como el GIGO al recolectar y utilizar datos. Al hacerlo, se puede asegurar que los datos se utilicen de manera justa y eficaz para informar las decisiones y mejorar los resultados.

Por aca incluyo algo para complementar , https://www.statice.ai/post/data-bias-types.

Un sesgo que ocurre con mucha frecuencia en mi pa铆s, es el considerar datos obtenidos de poblaci贸n que si cuenta con el medio para transmitirla a quien lo necesita, obviando as铆 a los ciudadanos que se encuentran en poblaciones alejadas. Creo que es la base de lo que se denomina finalmente como 鈥渃entralismo鈥.

Los algoritmos con sesgo racial y de g茅nero son un problema que venimos arrastrando desde los a帽os 80:

https://www.xataka.com/inteligencia-artificial/algoritmos-sesgo-racial-genero-problema-que-venimos-arrastrando-anos-80

驴Qu茅 otros tipos de sesgos suceden en las empresas?

  • Aversi贸n a la p茅rdida
  • Efecto Forer
  • Sesgo de confirmaci贸n
  • Sesgo retrospectivo
  • Sesgo del punto ciego
  • Sesgo de disponibilidad

https://deepnote.com/@mazzaroli/Etica-y-Manejo-de-Datos-para-Data-Science-e-Inteligencia-Artificial-6fbe98ba-5e1c-48ea-8b7b-42e98f6b2bac

En las empresas, tambi茅n pueden ocurrir diversos tipos de sesgos en cuanto a los datos que recopilan y c贸mo los utilizan. Algunos de los sesgos m谩s comunes incluyen:

  1. Sesgo de selecci贸n de datos: Es la tendencia a seleccionar datos que respaldan una hip贸tesis o suposici贸n, en lugar de considerar toda la informaci贸n disponible. Esto puede llevar a la toma de decisiones basadas en informaci贸n incompleta o sesgada.

  2. Sesgo de muestreo: Es la tendencia a recopilar datos de una muestra que no representa adecuadamente la poblaci贸n en cuesti贸n, lo que puede llevar a conclusiones err贸neas y decisiones incorrectas.

  3. Sesgo de confirmaci贸n de hip贸tesis: Es la tendencia a buscar evidencia que respalde una hip贸tesis preconcebida, en lugar de considerar todas las posibles explicaciones. Esto puede llevar a la toma de decisiones sesgadas y a la exclusi贸n de informaci贸n relevante.

  4. Sesgo de disponibilidad de datos: Es la tendencia a utilizar datos que est谩n f谩cilmente disponibles en lugar de buscar o recopilar datos m谩s completos o precisos. Esto puede llevar a decisiones basadas en informaci贸n limitada o incompleta.

  5. Sesgo de omisi贸n: Es la tendencia a no recopilar ciertos tipos de datos, lo que puede llevar a decisiones basadas en informaci贸n incompleta o sesgada.

Es importante que las empresas reconozcan la existencia de estos sesgos en la recopilaci贸n y uso de datos y tomen medidas para minimizar su impacto. Esto puede incluir la implementaci贸n de pol铆ticas y pr谩cticas que promuevan la objetividad y la revisi贸n cr铆tica de la informaci贸n disponible, as铆 como la diversificaci贸n de las fuentes de datos y la evaluaci贸n cuidadosa de la representatividad de los datos recopilados.

  • Sesgo pol铆tico y comunitario:
    En el sector p煤blico hay casos donde se quiere llevar cobertura a los corregimientos donde el acceso al internet es nulo, un corregimiento de un municipio 鈥渪鈥 puede haber o tener 2 mil habitantes y muchos de estos no poseen computadores port谩tiles y smarthphone para hacer un uso adecuado de los recursos tecnol贸gicos en la poblaci贸n.

Otros tipos de sesgos:

  • Genero.

  • Econ贸micos.

  • Religiosos.

  • Culturales.

TIPOS DE SESGOS

  • Sesgo de selecci贸n: puede ocurrir cuando la selecci贸n de los datos se basa en criterios limitados o preconcebidos, lo que puede llevar a conclusiones inexactas o limitadas. Por ejemplo, una empresa que se enfoca 煤nicamente en la informaci贸n de clientes frecuentes puede estar perdiendo datos valiosos sobre clientes potenciales.

  • Sesgo de confirmaci贸n: puede ocurrir cuando se seleccionan y analizan datos que respaldan preconcepciones previas, mientras se ignoran los datos que no los respaldan. Esto puede llevar a decisiones sesgadas y limitadas en lugar de una visi贸n completa y equilibrada.

  • Sesgo de disponibilidad: puede ocurrir cuando se basan las conclusiones en los datos que est谩n f谩cilmente disponibles, en lugar de buscar datos m谩s completos y precisos. Esto puede llevar a conclusiones inexactas o incompletas.

  • Sesgo de muestra: puede ocurrir cuando la muestra de datos utilizada para el an谩lisis no es representativa de la poblaci贸n total, lo que puede llevar a conclusiones inexactas. Por ejemplo, una empresa que se basa en una muestra de clientes que no representa adecuadamente la diversidad de su base de clientes puede tomar decisiones inexactas y limitadas.

  • Sesgo de atribuci贸n: puede ocurrir cuando se atribuyen causas o motivos incorrectos a los datos, lo que puede llevar a conclusiones inexactas. Por ejemplo, una empresa puede atribuir la baja tasa de conversi贸n de ventas a la falta de inter茅s del cliente, cuando en realidad puede ser un problema con el dise帽o del sitio web.

  • Sesgo cultural: puede ocurrir cuando las pr谩cticas de recopilaci贸n y an谩lisis de datos est谩n influenciadas por los prejuicios culturales o sociales, lo que puede llevar a conclusiones inexactas o limitadas. Por ejemplo, una empresa que no tiene en cuenta las diferencias culturales en su base de clientes puede perder informaci贸n importante.

Sesgo de confirmaci贸n: Este sesgo se produce cuando las personas buscan y dan m谩s peso a la informaci贸n que confirma sus creencias preexistentes, mientras que descartan o ignoran la informaci贸n que contradice esas creencias.

sesgos politicos
sesgos de consumo
sesgos de edad
sesgos de nivel economico

-En el 2008 en Estados Unidos la banca tuvo el sesgo (Ceguera por falta de atenci贸n), al vender hipotecas a personas que posiblemente no podr铆an pagarlas y eso causo la gran burbuja inmobiliaria.
-Diferentes estudios globales de biodiversidad a partir de las predicciones generadas por diferentes modelos de nicho ecol贸gico. Habitualmente, estos modelos se calibran con datos procedentes de bases de datos de libre acceso. Sin embargo, a pesar de la facilidad de descarga y de la accesibilidad de los datos, la informaci贸n almacenada sobre las localidades donde est谩n presentes las especies suele tener sesgos y errores.
(Utilizar informaci贸n de f谩cil descarga)

creo que los sesgos m谩s comunes son los relacionados a las preconcepciones humanas, las cuales son influenciadas por la cultura local, de tal manera una empresa en una regi贸n costera puede tener segos relacionados al estilo de vida de las personas que viven en la regiones monta帽osas, y as铆 cuando una de estas solicite un servicio a esta no posea la capacidad de suplir sus necesidades.

Eliminar el BIAS (el siesgo) es una tarea dificil ya que no depende solamente de los datos pero tambien del equipo que analiza y intrepreta los datos. Yo creo que con el crescimiento de empresas data driven nos daremos cuenta de nuevos siesgos y nuevas formas de 鈥渆liminarlos鈥.

Los sesgos que usan los medios de comunicaci贸n para hacernos creer una noticia que beneficie o empeore la imagen de candidatos pol铆ticos.

Cada dia es mas importante separar por sectores y tener bien la informacion para que sea bueno nuestro resultado.

mi aporte

Otro tipo de errores que comenten algunas empresas es cuando hacen recorte de personal.
En muchas ocasiones, se lo dejan a un 3ro que mediante un examen de confianza determinan si puede seguir laborando o no.
Adicional que este examen no est谩 bien definido, pues son preguntas muy arcaicas que no siempre determinan si una persona es confiable o no, por ende, terminan recortando personal altamente calificado y eficiente por culpa de una prueba mal estructurada.

Sesgo de disponibilidad, a veces podemos pensar que lo que vemos es lo que hay y podemos pasar por alto datos que no hay actualmente pero que si puede presentarse en el futuro.

GIGO (Garbage In, Garbage Out)

BIAS (Sesgo)

Los sesgos que pueden tener las empresas pueden ser de tipo de: condici贸n social, g茅nero, grupos de edad, lugar donde se vive o zona geogr谩fica.

Hola a tod@s.

La variable promedio siempre ser谩 un tipo de dato sesgado ya que muestra un numero general dentro de la data analizada, enmascarando realidades de los puntos m谩ximos y m铆nimos.

Saludos!
Magda Paez

Hay muchos tipos de sesgos y errores que pueden incurrir las empresas y el sector p煤blico al recopilar y utilizar datos. Algunos de los m谩s comunes incluyen:

  1. Sesgo de selecci贸n: Este sesgo ocurre cuando la muestra de datos no es representativa de la poblaci贸n total, lo que puede llevar a conclusiones incorrectas.

  1. Sesgo de confirmaci贸n: Este sesgo ocurre cuando se buscan solo datos que confirman una hip贸tesis o creencia previa, ignorando aquellos que no lo hacen.

  1. Sesgo de recolecci贸n: Este sesgo ocurre cuando la recopilaci贸n de datos est谩 influenciada por prejuicios o inclinaciones personales.

  1. Errores de medici贸n: Estos errores ocurren cuando los datos recopilados son imprecisos o inconsistentes, lo que puede afectar la precisi贸n de los resultados.

  1. Errores de codificaci贸n: Estos errores ocurren cuando los datos se codifican de manera incorrecta durante el proceso de an谩lisis, lo que puede llevar a conclusiones incorrectas.

Es importante ser consciente de estos sesgos y errores y tomar medidas para minimizarlos y garantizar la calidad de los datos y los resultados basados en ellos. Esto puede incluir la revisi贸n independiente de los datos, la verificaci贸n de la precisi贸n de los datos y la aplicaci贸n de t茅cnicas de validaci贸n adecuadas.

Es vital asegura la buena calidad de las muestras sin caer en sesgo, como ejemplo puede ser analizar gustos musicales de una poblaci贸n sin considerar las diferencias de edades o culturales.

Por ejemplo, hace unos anos una marca de Colgate, por ejemplo decia que la mayoria de los dentistas recomiendan colgate. Si bien es publicidad, que nos asegura que realmente la mayoria de estos profesionistas recomiendan aquella marca.
Si se realizo un estudio, se selecciono posiblemente dentistas que ya utilizaban colgate.

En los procesos de selecci贸n y reclutamiento hay bastante sesgos, bien sea porque existen sesgos cognitivos, como bien porque al haber tanta informaci贸n para analizar, los reclutadores se abruman y toman decisiones inadecuadas. Es importante hacer un an谩lisis importante en esos procesos. https://www.armstrong.com.mx/contenidos-especializados/blog/sesgos-en-reclutamiento-y-seleccion/ https://www.icims.com/es/blog/12-sesgos-cognitivos-que-pueden-perjudicar-tus-procesos-de-seleccion/

El algoritmo de Spotify me clasifica y sugiere m煤sica mexicana, sin embargo esas sugerencias no son de mi gusto. Creo que nos clasifica a todos los de am茅rica del sur como mexicanos.

M谩s que por raza, hay muchos BIAS en cuanto a g茅nero, religi贸n, econ贸mica, e incluso por preferencias y estilos de vida.

Es un tema amplio que aunque se est谩 trabajando sigue estando presente en nuestro d铆a a d铆a.

Los estereotipos de g茅nero, generado por IA, por esto es importante involucrar y atraer talento diverso a los equipos que desarrollan modelos de Machine learning.

https://www.linkedin.com/posts/usaria_sesgo-de-g茅neroia-ugcPost-7007019977064996864-SRAQ?utm_source=share&utm_medium=member_desktop

Esto me recuerda al sesgo de la negatividad(negativity bias):

Le damos mas importancia a los eventos negativos que a los eventos positivos o neutros. Esto se debe a un rasgo de supervivencia que nos dice: las cosas positivas son buenas pero las malas te pueden hacer da帽o. Por esto es que las noticias son principalmente tragedias o cosas que infunden el miedo, pues es lo que mas llama la atenci贸n. Fue demostrado que traemos esto cableado en el cerebro por un experimento de un bebe que mostros signos de este sesgo a los 7 meses.

驴Qu茅 otros tipos de sesgos crees que suceden en las empresas?:

El sesgo en los pronosticos de presupuesto, ya que hay algunas empresas que tienen mayores ventas por temporadas, por lo que es importante tener eso en cuenta para los presupuestos de los meses mas altos y bajos, de esa manera evitando la falta de stock y la sobre compra de stock respectivamente, como una tienda de trajes de ba帽o.

Otro tipo de sesgos que se pueden presentar se encuentra en no representar adecuadamente el sexo, lo cual puede afectar el output del an谩lisis

Hay muchos tipos de sesgos que pueden ocurrir durante la recolecci贸n de datos. Algunos ejemplos comunes incluyen:
1.-Sesgo de selecci贸n esto ocurre cuando la muestra de datos no es representativa de la poblaci贸n. Por ejemplo, si solo se entrevista a personas j贸venes para un estudio sobre el comportamiento del consumidor, los resultados no ser谩n representativos de toda la poblaci贸n.
2.-Sesgo de conocimiento esto ocurre cuando el entrevistador o el encuestador tiene un conocimiento previo del tema de la investigaci贸n, lo que puede influir en la forma en que hacen las preguntas o interpretan las respuestas.
3.-Sesgo de respuesta esto ocurre cuando los participantes no responden de manera sincera o honesta a las preguntas.
4.-Sesgo de observador esto ocurre cuando el observador tiene una expectativa o una predisposici贸n que puede influir en c贸mo observa o interpreta lo que est谩 viendo.

Sesgo de publicaci贸n se define como la tendencia a publicar investigaciones con resultados positivos (se encuentra asociaci贸n, se encuentran diferencias) y a dejar de hacerlo con aquellas que muestran resultados negativos (no se encuentra asociaci贸n, no se encuentran diferencias). Tambi茅n puede aplicarse a la publicaci贸n de resultados (art铆culos) que por ser convenientes o m谩s le铆dos se privilegiar铆an por el autor para ser enviados a una revista o por el editor para ser publicados

El sesgo de publicaci贸n

Si aplicamos esto a los datos recopilados por ejemplos en campa帽as de Marketing que no nos favorecen se lleva a cabo el Sesgo de publicaci贸n