Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Inferencia Estadística

12/24
Recursos

Aportes 112

Preguntas 4

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Que interesante puede ser un tema cuando lo explican tan bien

https://github.com/karlbehrensg/programacion-dinamica-y-estocastica
Inferencia Estadística

Con las simulaciones podemos calcular las probabilidades de eventos complejos sabiendo las probabilidades de eventos simples.

¿Que pasa cuando no sabemos las probabilidades de los eventos simples? Las técnicas de la inferencia estadística nos permiten inferir/concluir las propiedades de una población a partir de una muestra aleatoria.

“El principio guía de la inferencia estadística es que una muestra aleatoria tiende a exhibir las mismas propiedades que la población de la cual fue extraída.” - John Guttag

Ley de los grandes números

Con la ley de los grandes números podemos ver que en pruebas independientes repetidas con la misma probabilidad p de un resultado, la fracción de desviaciones de p converge a cero conforme la cantidad de pruebas se acerca al infinito.

Falacia del apostador

La falacia del apostador señala que después de un evento extremo, ocurrirán eventos menos extremos para nivelar la media.

La regresion a la media señala que después de un evento aleatorio extremo, el siguiente evento probablemente será menos extremo.

Que buena clase… Quien diría que David es abogado

Me gustó mucho el concepto de Falacia del apostador (creer equivocadamente que luego de sucesos extremos van a ocurrir sucesos extremos opuestos). y también que las muestras tienden a exhibir comportamiento de la población. 😱

Muy buena explicación, solo que yo soy mas de la idea de pensar que la programación es una forma de representar las matemáticas, no al contrario, finalmente las matemáticas son el lenguaje universal.

Yo caí en esa falacia jajaja, perdí todo en la ruleta

Los cursos son hasta el momento de Analisis Numerico Universitario, pero es una version lite.

las muestras tiene que ser representativas y aleatorias

Que alguien me corrija yo lo que entendi en pocas palabras es

  • entre mas muestras y pruebas se hagan sin sesgo mas tiendes a tener los datos correctos …
  • la falacia del apostador dice que despues de un evento extremo se anivelara con un conjunto de sucesos menos extremos para anivelar la media
  • cuando lo que pasa es la regresion a la media que aun que un evento extremo pase . el siguiente evento probablemente sea menor a este .

Para comprender más la ley de los grandes números pueden revisar este enlace:
Ley de números grandes (Khan Academy)

Sumamente interesante este concepto de la Falacia del Apostador, la cual la desconocía pero por simple definición de probabilidades sabía que debía existir algo que explique esto, pero por fin pude encajar este concepto con un caso que me pasaba mucho en mis épocas frikis, les explico.

En los juego de pokémon existe un concepto llamado “pokémon shiny”. La cual es una característica que hace que los pokémon tengan un color diferente a al color natural, son sumamente raros y por consiguiente muy codiciados(antes más que ahora). La probabilidad de que un pokémon salvaje sea shiny es de 1 entre 4096, entonces muchos pensaban que entre más veces les apareciera X pokémon las probabilidades de que sea shiny aumentarían. Entonces muchos buscaban desesperados el encuentro 4096 para darse la desilusión de que no es shiny.

La cuestión es que nunca suple explicarlo más allá de la definición de probabilidades. Pero me satisface saber que, aunque tarde, logré con dar una respuesta a esta interrogante.

Me encantó esta clase!

La falacia del apostador

Para completar un poquito mas

Me encanta como explica el profe, todo es muy ameno.

Como se nota el gusto por el tema, te lo transmite y acabas disfrutando mientras aprendes

Ley de los grandes números

El principio guía de la Inferencia Estadística es que una muestra aleatoria tiende a exhibir las mismas propiedades que la población de la cual fue extraída.

¿Cuales son los criterios para saber que el tamaño de una muestra es lo suficientemente bueno para poder inferir de manera correcta?

Una anecdota para entender la importancia de la regresión a la media, sacada del libro Thinking Fast and Slow, del Nobel Khanemann.
Durante mucho tiempo, se pensaba que premiar a los soldados cuando hacian maniobras excelentes tenía consecuencias negativas en sus futuros rendimientos, porque sus siguientes maniobras no eran tan buenas. Del mismo modo, se pensaba que castigarlos despues de maniobras desastrosas era positivo porque sus siguientes maniobras eran mejores. Lo que ocurría era una simple regresión a la media (no puedes hacer siempre una maniobra excelente o siempre desastrosa), y habia que eliminar ese efecto para ver que efectivamente, premiar a los soldados después de una buena maniobra, tenía consecuencias positivas en su futuro rendimiento.

No es lo mismo “grandes números” que “números grandes”

Representación visual de la Inferencia Estadística ⚠️⚠️⚠️

Se nota que disfruta su trabajo.

muy bien explicado.

que buen tema

Explicación 10/10, hasta ahora este curso ha estado bastante entretenido:)

me encanta estoy super emocionado

Bueno como comentario y aporte:

  • Lo mas importante de la inferencia estadistica es entender que para que se produzca los eventos sucesivos deben ser independientes.
  • Como en esta clase se ejemplifico, si los eventos sucesivos son independientes como en el caso de la ruleta de montecarlo, las probabilidades del proximo evento no se ven afectadas debido a que los proximos eventos son independientes.
  • Un caso donde no aplica, es la paradoja de Monty Hall, en el cual se plantea el siguiente problema:
    Un concursante debe elegir una puerta entre tres (todas cerradas); el premio consiste en llevarse lo que se encuentra detrás de la elegida. Se sabe con certeza que tras una de ellas se oculta un automóvil, y tras las otras dos hay cabras. Una vez que el concursante haya elegido una puerta y comunicado su elección a los presentes, el presentador, que sabe lo que hay detrás de cada puerta, abrirá una de las otras dos en la que haya una cabra. A continuación, le da la opción al concursante de cambiar, si lo desea, de puerta (tiene dos opciones). ¿Debe el concursante mantener su elección original o escoger la otra puerta? ¿Hay alguna diferencia?
  • La solución a esta pregunta es que se debe cambiar de puerta una vez el presentador abre una nueva puerta. ¿Porque?. Porque el presentador conoce a príori que la puerta que abrirá contiene una cabra. Como el presentador conoce esta información, las probabilidad de obtener el auto al cambiar de puerta aumenta, debido a que el evento no es independiente del anterior.
  • Para entender esto me base en estas fuentes por si alguien lo quiere profundizar.
  • https://es.wikipedia.org/wiki/Problema_de_Monty_Hall
  • https://www.youtube.com/watch?v=1BpTBzDQuRE

no estoy aqui por el trading, pero fue imposible no pensar en trading durante la explicación de David

-AQUÍ UN DATAZO DE LOS CASINOS-

De hecho en la ruleta, la probabilidad de sacar un negro o un rojo, no es de 50%
.
En la ruleta europea además de los 18 números negros y los 18 números rojos también tiene un 0, lo cual hace que las probabilidades sean de un 48%

.
Y en la ruleta Americana además del 0 también incluyeron el 00, lo cual hace QUE LA CASA TENGA SOLO UN POQUITO MÁS DE VENTAJA.
Las probabilidades de sacar un negro o un rojo en esta ruleta son de 47%.

-FIN DEL DATAZO DE LOS CASINOS-

Podemos traer a nuestros programas estocásticos, toda la inferencia que queramos. Mayormente en ocaciones, en las que no tenemos una probabilidad distribuida.

La historia de los Casinos de Montecarlo: En una cadena de casinos en Mónaco, la ruleta tiró 32 orojos consecutivos. Lo que mucha gente dedujo, es que los próximos lanzamientos, serían negros. Ello llevó a las personas a apostar por el negro, cayendo en la falacia del apostador. La verdad es que el efecto que seguría, sería una regresión a la media, por lo que las probabilidades, siempre siguieron siendo las mismas y la gente perdió mucha plata.

La regresión a la media propone: Después de un evento aleatorio extremo, el siguiente evento problablemente será menos extremo.

La Falacia del apostador: Asegura, que después de un evento extremo, ocurrirán eventos menos extremos para nivelar la media.

Conforme nuestras muestras tienden al infinto, se acerca cada vez más a uno.

La ley de los grandes números, es la base de nuesta estadística inferencial: En pruebas independientes repetidas con la misma probabilidad p de un resultado, la fracción de desviaciones de p converge a cero conforme la cantidad de pruebas se acerca al infinito.

La variabilidad que hay dentro de cada muestra, es la desvianza y la desviación estándar.

Hay que tener en cuenta, que se tienen que sacar varias muestras. Pero más allá de eso, también está que la probabilidad de que los promedios entre las muestras y el conjunto sean iguales, es más alto, entre más muestras tomes.

La forma en cómo podemos resolver muchos problemas grandes, es solo haciendo, una inferencia estadística.

La muestra tiene que ser aleatoria.

El poder de la estadística inferencial y su base, es el hecho de medir a partir de pequeños conjuntos.

Las muestras, tienden a exhibir las características de la población.

John Guttag, dice "El principo guía de la inferencia estadística es que una muestra aleatoria tiende a exhibir las mismas propiedades que la población de la cuál fue extraida.

La inferencia estadística, es la deducción que damos a ciertos resultados de una población a través de una muestra aleatoria de esta.

¿Qué pasa si nosotros no sabemos las posibildades de los eventos simples? Es ahí cuándo entra la inferencia estadística.

Con las simulaciones, se pueden calcular las probabilidades de eventos complejos, sabiendo las probabilidades de eventos simples.

La diferencia entre censo y encuesta es que el censo es el estudio de la poblacion entera, mientras que la encuesta es una muestra o una parte de la población.

Notas de la sesión 😃
Inferencia estadística.

  • Con las simulaciones podemos calcular las probabilidades de eventos complejos sabiendo las probabilidades de eventos simples.
  • ¿Qué pasas cuando no sabemos las probabilidades de los eventos simples?
  • Las técnicas de la inferencia estadística nos permiten inferir/concluir las propiedades de una población a partir de una muestra aleatoria.

El principio guía de la inferencia estadística es que una muestra aleatoria tiende a exhibir las mismas propiedades que la población de la cual fue extraída. - John Gutttag.

  • Tomamos una muestra de la población que sea representativa y aleatoria. Analizamos la muestra, y las conclusiones se aplican a la población. Esto es inferencia.
  • Ley de los grandes números: En pruebas independientes repetidas con la misma probabilidad $p$ de un resultado, la fracción de desviaciones de $p$ converge a cero conforme la cantidad de pruebas se acerca al infinito:

$$P(\lim_{n\to \infty} \bar{X}_n = \mu) = 1$$

  • Falacia del apostador:
    • La falacia del apostador señala que después de un evento extremo, ocurrirán eventos menos extremos para nivelar la media. Un ejemplo es en un casino, en la ruleta de montecarlo, cuando cayeron ~32 rojos, y las personas pensaron que iban a ocurrir ~32 negros, pero ps nel 😆.
    • La regresión a la media señala que después de un evento aleatorio extremo, el siguiente evento probablemente será menos extremo.

¿Por qué en los dados, la probabilidad de que caiga un 6 es 1/6, pero al tirarlo dos veces la probabilidad de que caigan dos 6 seguidos es 1/36, o de que al tirarlo dos veces caiga al menos un 6 es 11/36?
¿Cuándo se debe calcular la probabilidad individual como en el caso de la ruleta (que aunque hayan caído 32 negros la probabilidad de un rojo es igual) y cuándo de forma conjunta o que “depende” del evento pasado como cuando hicimos el ejercicio de los dados?

Excelente!

La falacia del apostador se aplicaría cuando un jugador va a patear un penal. Si patea 5 veces seguidas hacia la izquierda, la 6ta vez tiene un 33% de probabilidad de patear a la izquierda, 33% al centro y 33% a la derecha.

semestres enteros de universidad para que en 5 minutos te dejen todo en claro. tremendo david

a mi me explicaron esto en la universidad, hace como 8 años, de haber sabido que me dedicaria a esto, me hubiese gustado perdirle a la profesora que explicara con ganas jajaja

Entendido y a poner en práctica

Muy bueno

No conocía el Caso de Montecarlo

Hay que recalcar que muchas veces las muestra tampoco son suficientes a la hora de realizar inferencia estadística. Un ejemplo, que me daban en la universidad es que supongamos que queremos saber cómo afecta la educación al salario, conocido como la ecuación de Mincer. Lo que nosotros tenemos que tener cuidado es que la intuición nos dice, listo necesito una muestra de las personas que tienen cierto salario y cierto nivel de educación, sin embargo, debemos tener cuidado con dejar afuera a las personas que no tienen un salario. Por eso puede ser llegar a ser complicada la inferencia y las muestras estar sesgada si no planteamos bien nuestros problema. Esto se le suele conocer como sesgo de selección.

Si quieren ganar en la ruleta vean este interesante planteamiento

https://es.wikipedia.org/wiki/Martingala

Pero tengan cuidado los casinos igual por eso ponen apuestas máximas !

Excelente.

De hecho en una ruleta, siempre hay una sección especial donde no gana ni rojo ni negro, así que la casa tiene 50% más un poquito más de probabilidad de ganar. Nunca es 50% 50% la probabilidad de ganar ni con rojas ni con negras. Ese pequeño margen hace que la casa siempre gane.

Una vez jugando en el casino, ruleta (tengo mis reservas y creo que electrónicamente pueden ser manipuladas) me fue pésimo jajajaja

Aunque apostaba mitad negros, mitad roos, y mitad numeros altos y mitad números bajos, me fue mal. Eso sí, cuando me meto en juegos al azar lo hago como si fuera a un parque de diversiones: determino un número máximo de dinero a gastar en las diversiones, más de eso jamás gasto.

NOTA: jugando poker, mi primera vez en casino, llegué a la 4ta posición, solo con el presupuesto destinado, cañando 3 veces y aprendiendo al final que el otro tenía la probabilidad de sacar una escalera mientras yo me confiaba de mi trío de Jotas.

Que excelente clase !

Muy buena explicación!

![](

Good class!

en el juego del black jack se puede predecir el valor de las cartas que quedan en el zapato en base a las cartas que salieron en cada jugada, aquí hay una dependencia, por lo tanto cada jugada no es independiente como en la ruleta.

https://www.youtube.com/watch?v=uz58hg0EJAY

La media es el valor promedio de la muestra o de una población

ko

Muy buena explicación

Conceptos aparentemente complicados explicados claramente en 10 minutos, excelente.

Muy interesante!

Explicación complementaria de inferencia estadística:

http://www.ub.edu/aplica_infor/spss/cap4-1.htm

En data science se puede aplicar Validación cruzada o Cross-validation para poder analizar una población. Y para revalidar se puede utilizar K-Fold.

Wow! No sabia nada de la falacia del apostador. Gran aporte

Interesante clase profesor.

que buen aporte lo de la falacia del apostador…no sabia que existia eso.!!..buena clase

Esta clase me trajo muchos recuerdos. Durante mi tercer año en la universidad empecé a ir al casino con un amigo para jugar a la ruleta. Varias veces gané pero en ocasiones perdí mucho dinero. Utilizaba la estrategia de las Martingala y aprendí a la mala sobre la Falacia del Apostador. A pesar de todo tengo buenos recuerdos de esa época.

import random

def tirar_dado(numero_de_tiros):
    secuencia_de_tiros = []

    for _ in range(numero_de_tiros):
        tiro_1 = random.choice([1, 2, 3, 4, 5, 6])
        tiro_2 = random.choice([1, 2, 3, 4, 5, 6])
        tiro = tiro_1+tiro_2
        secuencia_de_tiros.append(tiro)

    return secuencia_de_tiros

def main(numero_de_tiros, numero_de_intentos):
    tiros = []
    for _ in range(numero_de_intentos):
        secuencia_de_tiros = tirar_dado(numero_de_tiros)
        tiros.append(secuencia_de_tiros)

    tiros_con_12 = 0
    for tiro in tiros:
        if 12 in tiro:
            tiros_con_12 += 1

    probabilidad_tiros_con_1 = tiros_con_12 / numero_de_intentos
    print(f'Probabilidad de no obtener por lo menos un 12 en {numero_de_tiros} tiros = {probabilidad_tiros_con_1}')

if __name__ == '__main__':
    numero_de_tiros = int(input('Cuantas tiros de los dados: '))
    numero_de_intentos = int(input('Cuantas veces correra la simulacion: '))

    main(numero_de_tiros, numero_de_intentos)```

Principio de Inferencia Estadística.

Wow, con semejante explicacin entendi a la perfección.

Muy bien Gran explicación

Muy buena explicación.

Que interesante clase.

Exclente esta clase, me encantó. El potencial de la aplicación de la teoría de los grandes números para muestreo aleatorio en investigaciones sociales es impresionante.

Ley de los grandes números.

La Falacia del apostador.

La Inferencia Estadística

Litcoin, aquí te voy!!

Tomar una muestra representativa y no sesgada es a veces una difícil tarea

Inferencia estadística
Fenómeno que indica que muestra aleatoria tiende a exhibir las mismas probabilidades de la población, siempre cuando esta muestra no esté sesgada (sea elegida aleatoriamente).

Ley de Grandes Números:
En pruebas independientes repetidas con la misma probabilidad p de resultado, la fracción de desviaciones de p converge a cero conforme la cantidad de pruebas se acerca al infinito.
Lo que implica que mientras más pruebas hagamos las probabilidades obtenidas por estas muestras más se acercarán a la probabilidad matemática

Falacia del Aportador
Falsa creencia de que después de un evento extremo ocurrirá el evento contrario para compensar la media.
Lo que realmente ocurre es una regresión a la media: después de ocurrido un evento aleatorio extremo lo más probable es que el siguiente sea menos extremo (más cercano a la media)

Ley de los grandes números
Podemos observar con la ley de los grandes números que en pruebas independientes repetidas con la misma probabilidad P de un resultado, la fracción de desviaciones de P converge a cero conforme la cantidad de pruebas se acerca al infinito.

Excelente clase muchísimas gracias por explicar de esta forma.

Me gustaría agregar como otra falacia del apostador podría ser, que tomas una moneda y la comienzas a lanzar para ver si sale cara o cruz, te salen 10 caras seguidas.

Por la falacia del apostador podrías creer que la siguiente vez que lances la moneda hay más probabilidades de que salga cara porque ya te salió 10 veces seguidas antes.

O por el contrario puedes creer que porque te salió diez veces seguidas la siguiente lo más probable es que salga cruz, pero como se menciona en esta clase, es parte de la falacia del apostador, sigue existiendo la misma probabilidad del 50% de que salga cara o que salga cruz.

Y esta es la parte grandiosa donde se fusiona la ciencia con la psicología en conjunto con la programación.
Todos estos “errores” forman parte de los llamados “Sesgos Cognitivios” y justamente el ejemplo que muestra se deriva en Sesgo de “Regresión a la Media”

A mi siempre me enseñaron que describir (inferir/concluir) las propiedades de una población era estadistica descriptiva y inferencia estadistica se reservaba para el contraste de hipotesis.

Que suerte jajaj

Wow! No sabía el origen de los procesos de Montecarlo era esa historia del casino. Gran ejemplo para luego explicar las cadenas de Markov.

Dejo un resumen de la clase de Aroesti
Estaba muy interesante la clase 😄 recordé variso conceptos que vi en al universidad.

Algunas preguntas que se responden con la clase:
¿Por qué es importante la inferencia estadística?
¿Por qué es importante la ley de los grandes números en estadística?
¿Qué es la falacia del apostador?

muy interesante

Este el el tipo de razonmiento frecuentista, es decir que un evento no tiene nada que ver con el otro, para un Bayesiano, la primera pregunta antes de preguntarse si el siguiente color será negro es, ¿La ruleta de verdad está girando aleatoriamente?