You don't have access to this class

Keep learning! Join and start boosting your career

Aprovecha el precio especial y haz tu profesión a prueba de IA

Antes: $249

Currency
$209
Suscríbete

Termina en:

0 Días
7 Hrs
36 Min
31 Seg

Intervalos de confianza

10/22
Resources

What are confidence intervals and why are they important?

Confidence intervals are an essential tool in statistics, data science and artificial intelligence. They allow estimating the range of values within which an unknown value of a population parameter is likely to lie, with a certain level of confidence. This concept is key to understanding the variability of data and assessing the reliability of the results obtained in a study.

How do confidence intervals work?

In general terms, a confidence interval defines a range of values, from a lower limit to an upper limit, within which an unknown population parameter is expected to lie. The width of the interval is determined by the confidence level chosen, which is usually 68%, 95% or 99%. These values are the most commonly used in statistical analysis due to their balance between precision and practicality.

When we speak of population mean (represented by µ), we imagine a distribution where the mean is at the center. From there, there are deviations downward (to the left side) and upward (to the right side). If we choose a confidence index of 99%, we are being very strict and expecting almost all possible values to fall within that range. On the other hand, a confidence of 68% indicates a wider interval and less absolute certainty.

What is the significance level?

The significance level, represented by alpha (α), helps us determine when we should reject a null hypothesis in a statistical study. The null hypothesis is the statement that there is no significant difference between two populations or phenomena. If the α value is exceeded by the observed data, the result is considered to be statistically significant.

This critical value gives us the probability of making a mistake in rejecting the null hypothesis. For example, if the significance level is 5%, there is a 5% probability that any observed differences are due to chance. Thus, low alpha values suggest greater confidence in the statistical results presented.

How are the results interpreted?

To interpret a 95% confidence interval, it is stated that we have 95% confidence that the true value of the parameter is within the stated range. For example, if the height of people who ski is evaluated and the interval ranges from 160 cm to 165 cm, it means that with 95% confidence, the average height of the population is between those values.

The distribution at the extremes of the interval is also crucial. In a 99% interval, 0.5% of the probabilities are distributed both downward and upward. This is extremely useful in data science and artificial intelligence to compare and contrast different distributions, such as students studying different hours and their academic performance.

Practical example in data analysis

Imagine we compare students who spend 20 hours studying versus others who spend only 5 hours. Our goal is to compare their final grades. In this case, the more studious group is likely to obtain a higher average grade contained in a narrower confidence interval. On the contrary, students who study less might show a wider interval due to greater variability in their academic results. This allows researchers to provide more accurate conclusions about the impact of study time on academic performance.

In summary, relying on confidence intervals not only enriches our statistical analysis but also facilitates informed decision making in various fields. Keep learning and deepening your knowledge in statistics to master these concepts, which are pillars in the data-driven era!

Contributions 24

Questions 3

Sort by:

Want to see more contributions, questions and answers from the community?

Le pedí a chaGPT que explicara que es un intervalo de confianza. No sé si los números estan bien o mal, pero lo importante es el concepto.
"Imagina que un niño quiere saber cuánto mide su perro. El niño mide al perro varias veces y obtiene una serie de medidas ligeramente diferentes cada vez. El niño se pregunta cuál es la medida “correcta” y cuánto margen de error hay en las medidas que tomó.

Un intervalo de confianza puede ayudar al niño a responder estas preguntas. Un intervalo de confianza es un rango de valores dentro del cual se espera que se encuentre el valor verdadero de la medida que se está estimando, con cierto nivel de confianza.

Por ejemplo, si el niño mide al perro varias veces y obtiene medidas de 60 cm, 62 cm, 61 cm, 63 cm y 59 cm, puede calcular un intervalo de confianza para estimar la verdadera altura del perro. Supongamos que utiliza un nivel de confianza del 95%. El niño puede calcular que el intervalo de confianza para la altura del perro es de 58 cm a 64 cm, lo que significa que con un 95% de confianza se espera que la verdadera altura del perro se encuentre en ese rango.

En resumen, un intervalo de confianza es una forma de estimar la verdadera medida de algo con cierto margen de error, y es una herramienta útil para tomar decisiones informadas basadas en datos."

Creo que el tema es de los más importantes y sería mejor explicarlo con mayor detalle.

El intervalo de confianza es una consecuencia de bootstrapping como punto de partida.
Bootstrapping es agarrar una muestra y como yo no se si esa muestra tiene los parámetros estadísticos de la población, entonces genero muchas grupos aleatorios de la misma muestra, cada una se calcula la media y todas esas medias que se pudieron generar muchas veces (ej. 100000), se hace un histograma. El resultado de ese histograma es una estimación más certera, si a ese histograma se calcula el 95% de los datos alrededor centrados. Ese es el intervalo de confianza al 95%. Entonces a mayor intervalo de confianza, ej 99% el intervalo es más abierto. A menor intervalo de confianza 68% el intervalo es más cerrado. Eso es lo opuesto a lo explicado en 1:35

Sobre la hipótesis nula, cuidado con el juego de palabras, en realidad es lo opuesto a lo explicado. La hipótesis nula siempre asume que no hay una diferencia estadística significativa. Es decir que todo es similar. Cuando aceptas la hipótesis nula, le das la razón que todo es similar. cuando rechazas la hipótesis nula, por el contrario aceptas que hay diferencias. En 2:54 menciona “no rechazar la hipótesis nula, es decir no rechazar que nuestras distribuciones sean diferentes”, ese texto indica que la hipótesis nula es la hipótesis de que hay diferencias, y esa es la definición de la hipótesis alternativa

Intervalo de confianza (IC):

El intervalo de confianza describe la variabilidad entre la medida obtenida en un estudio y la medida real de la población (el valor real). Corresponde a un rango de valores, cuya distribución es normal y en el cual se encuentra, con alta probabilidad, el valor real de una determinada variable. Esta «alta probabilidad» se ha establecido por consenso en 95%. Así, un intervalo de confianza de 95% nos indica que dentro del rango dado se encuentra el valor real de un parámetro con 95% de certeza5-8.

Eso seguramente te lo encuentras seguido en las encuestas de elecciones, cuando dan un porcentaje máximo y mínimo con cierto nivel de confianza. Porque a veces hay sorpresas? Recuerda los sesgos que por cierto también esta la profesora Silvia dando en el curso de Etica

Señores , por favor auditar el contenido de los cursos....
me parece o en la explicación, no sé es claro con los términos y significados ... tiende a confundir un poco

💡Para Pensar…

  • Una forma de interpretar los intervalos de confianza es imaginar que se tiene una población y de esta se extraen 1000 muestras diferentes con el fin de obtener un estimador, por ejemplo la media muestral para la edad. Si el intervalo de confianza es 95 % entonces 950 intervalos de confianza para la media contendrán el valor real de la media poblacional.
  • Además, tener presente que si se quiere tener un intervalo de confianza a un nivel de confianza alto (99 %) entonces el intervalo va ser más grande del que se construyera a un nivel de confianza inferior (90 %). Yo podría afirmar al 100 % de confianza que la edad de una persona de cierto país esta en el intervalo de 0 a 150 años, pero esto no tendría ninguna aplicación práctica.

Tienen que rehacer completamente esta clase, Dios mio la esplicación.

Esto también bastante mal explicado.

Un intervalo de confianza es un rango de valores que es probable que incluya el verdadero valor de un parámetro de una población dado un nivel de confianza específico. Es una forma de expresar la incertidumbre en una estimación de un parámetro poblacional. El nivel de confianza se expresa como un porcentaje, por ejemplo, un intervalo de confianza al 95% significa que si se tomaran varias muestras y se construyeran intervalos de confianza para cada una de ellas, el verdadero valor del parámetro estaría dentro del intervalo construido en aproximadamente el 95% de las muestras.

Hay varios métodos para construir un intervalo de confianza, y cada uno tiene sus propias consideraciones y aplicaciones. Por ejemplo, el método de la t-student se utiliza cuando la muestra es pequeña (menos de 30) o cuando la distribución de la población no es normal, mientras que el método de la distribución normal se utiliza cuando se cumple la suposición de normalidad y la muestra es suficientemente grande.
  • En general, los intervalos de confianza son una herramienta valiosa para entender la precisión de una estimación de un parámetro poblacional y para tomar decisiones basadas en esa estimación. Sin embargo, es importante tener en cuenta que un intervalo de confianza no garantiza que el verdadero valor del parámetro esté dentro del intervalo con una probabilidad del nivel de confianza especificado, sino que solo proporciona una estimación de la probabilidad de que eso ocurra.
El niver de significancia inicialmente lo entendi como la probabilidad de que ese valor no este en wl intervalo de confianza. el pedacito que le falta al nivel de co fianza n % para llegar a 100 pero wn otras fuentes hablan del rechazo de la hipotesis nula cuando es verdadera, asi que ya veremos que deparan las otras clases
El nivel de confianza de el n porciento es la probabilidad de que repwtido el experimento nuestro valor conciderado verdadero ( la pelotita que sacaste inicialmente de la bolsa de pelotitas con numeros) estara contenido en un intervalo dado para el n% de esos experimebtos. y en que intervalo? pues en el llamado intervalo de confianza
El nivel de confianza de el n porciento es la probabilidad de que repwtido el experimento nuestro valor conciderado verdadero ( la pelotita que sacaste inicialmente de la bolsa de pelotitas con numeros) estara contenido en un intervalo dado para el n% de esos experimebtos. y en que intervalo? pues en el llamado intervalo de confianza
**¿Qué es un intervalo de confianza?** Un intervalo de confianza es un rango de valores que estima un parámetro poblacional (como la media o la proporción) a partir de una muestra. En lugar de dar un único valor (como en una estimación puntual), el IC nos da un rango donde creemos que está el valor real con cierta certeza. Por ejemplo, si calculamos que el promedio de la presión en una tubería es de 50 psi con un intervalo de confianza del 95% (48 psi a 52 psi), estamos diciendo: "Estamos un 95% seguros de que la presión real de la tubería está entre 48 y 52 psi."
Hay una mezcla de conceptos frecuentistas y bayesianos, un intervalo de confianza nos dice que luego de hacer bootstrapping tenemos una confiaza del X% de que la verdadera media poblacional se encuentre en ese porcentaje de muestras, por ejemplo si realizamos 100 muestras y queremos un 95% de confianza esto implica que el 95% de nuestras muestras contendran dentro de un intervalo individual de cada muestra del X% la verdadera media poblacional. En el caso bayesiano usando una distribucion previa asumida por criterios arbitrarios existe una distribucion casi siempre normal de que el valor real de la poblacion este contenida en esta distribucion. Por lo que en resumen, el caso frecuentista asume que tenemos una media fija poblacional y la estimaremos con cierta confianza de que este en el X% de nusetras muestras con su respectiva intervalo de confianza, es mas un metodo que un numero. En el caso bayesiano, entendemos que partiendo de una distribucion asumida arbitraria el real valor caera dentro de una distribucion normal, esta confianza se puede aumentar o mejorar con mas datos pero en si no conocemos cual es la verdadera media, solo una estimacion.
En realidad mientras más alto sea el nivel de confianza mucho más amplio será el intervalo de confianza. Por ejemplo si inicialmente queremos un nivel de confianza del 95% para así determinar el relativo intervalo de confianza y sucesivamente quremos aumentar ese nivel de confianza al 99%, para tener una probabilidad mayor de que el intervalo de confianza contenga el parámetro dicho intervalo debe ser mucho más amplio.
Un intervalo de confianza es un rango que da una aproximación de los valores entre los cuales se encuentra el valor de un parámetro (media poblacional, varianza poblacional, etc) con un determinado nivel de confianza
Hay un error gravísimo en la clase mas importante del curso, es un horror esta clase, todo lo que afirma la docente es incorrecto, los estudiantes lo expresan en los comentarios y nadie corrige, nadie audita, nadie responde.

Recurso adicional 📎

Hola a todos, a continuación les dejo una explicación más detallada sobre intervalos de confianza, en lo personal me ayudado bastante a entender este tema.
.
https://www.youtube.com/watch?v=2wugQGs1GNY

.
Espero este aporte les sea de utilidad.

Este enlace de YouTube explica al detalle los intervalos de confianza, se los comparto: <https://www.youtube.com/watch?v=2wugQGs1GNY>

Este tema está bien denso

Saber acerca de Bootstrapping ayuda a entender esta clase.