Qué son las pruebas de hipótesis

Curso de Estadística Inferencial para Data Science e Inteligencia Artificial

Contenido del curso

No sé dónde empezar

Fundamentos de estadística inferencial

Estadísticos y cálculos

Pruebas de hipótesis y validación

Cierre del curso

22
Estadística inferencial aplicada al machine learning
01:28 min

Tomar examen

Qué son las pruebas de hipótesis

Resumen

Las pruebas de hipótesis son una herramienta estadística que te permite comprobar si existe una diferencia significativa entre el comportamiento de una muestra y el parámetro esperado de una población. Sirven para validar teorías con datos antes de tomar decisiones de negocio, y son clave en proyectos de ciencia de datos e inteligencia artificial.

¿Qué es una prueba de hipótesis y para qué sirve?

Una prueba de hipótesis, también llamada prueba de significación, te ayuda a juzgar si lo que observas en tus datos confirma o contradice una creencia previa. En lugar de quedarte con una intuición, mides qué tan probable es que el resultado ocurra por azar.

Piensa en una pregunta como: ¿la gente vive más en ciudades frías que en ciudades cálidas? Tu creencia normalizada es que el clima no cambia la esperanza de vida. Si los datos demuestran lo contrario, tienes que rechazar esa creencia y aceptar que sí hay una diferencia.

¿Qué es una prueba de hipótesis? Es un procedimiento estadístico para decidir si la diferencia entre tu muestra y el parámetro esperado es real o producto del azar.

¿Cómo se diferencia la hipótesis nula de la alternativa?

Toda prueba parte de dos planteamientos opuestos que debes definir antes de mirar los datos.

La hipótesis nula (H0) representa el escenario más esperado, el resultado normalizado, lo que cae en la concentración central de la distribución. En el ejemplo del clima, H0 sería que la gente vive igual en lugares fríos y cálidos.

La hipótesis alternativa (H1) es lo contrario: existe una diferencia real. En la distribución, H1 corresponde a los picos de los extremos, izquierdo o derecho. Si los datos te llevan ahí, rechazas H0 y te quedas con H1.

¿Cuándo rechazo la hipótesis nula? Cuando la evidencia estadística muestra una diferencia significativa al nivel de confianza que definiste, por ejemplo 99%.

¿Cómo aplicar esto a un caso de negocio?

Imagina que trabajas en una empresa que comercializa cervezas y quieres saber si en verano se vende más por el calor.

H0: las ventas son constantes durante todo el año, no hay diferencia por temporada.
H1: cuando hace más calor, las ventas de cerveza aumentan.

Si los datos confirman H1, tienes una base sólida para cambiar la estrategia comercial.

¿Cuáles son los pasos para hacer una prueba de hipótesis?

El proceso sigue una secuencia clara que te permite pasar de la pregunta al accionable.

Establecer H0 y H1: define la hipótesis nula y la alternativa con claridad.
Definir el nivel de significancia: decide con qué certeza vas a trabajar, típicamente 80%, 90% o 99%. Este nivel determina qué tan estricto eres al aceptar diferencias como reales.
Seleccionar el estadístico de prueba: elige la métrica con la que vas a comparar muestra y población.
Crear una regla de decisión: establece umbrales de acción. Por ejemplo, si la diferencia es significativa al 99%, cambias la estrategia; si solo lo es al 68%, no haces nada.
Validar y tomar acción: una vez confirmada o rechazada la hipótesis, ejecuta una decisión de negocio basada en el resultado.

El quinto paso es el que conecta el análisis con el impacto real. Hacer ciencia de datos sin tomar decisiones convierte el ejercicio en un reporte sin consecuencias.

¿Qué acción puedes derivar de un resultado significativo?

Siguiendo el caso de la cerveza, si confirmas que las ventas suben en temporada de calor con un nivel de confianza alto, una decisión natural sería adelantar la campaña publicitaria un mes antes del verano para ganarle terreno a los competidores.

Esa es la lógica completa: hipótesis, validación con cierto nivel de confianza y acción derivada. Sin ese cierre, los números se quedan en la pantalla.

¿Qué hipótesis te gustaría validar con datos en tu trabajo o proyecto? Cuéntalo en los comentarios.

Juan José Mamani Tarqui

Estudiante

QUE SON LAS PRUEBAS DE HIPOTESIS ?

En estadística, una prueba de hipótesis es un procedimiento para evaluar si una afirmación sobre una población es compatible con la evidencia proporcionada por una muestra de datos. Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis nula y la hipótesis alternativa.

Hipótesis nula (H0): Es la hipótesis que se probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia".

Hipótesis alternativa (H1): Es la hipótesis que se desea poder concluir que es verdadera de acuerdo con la evidencia proporcionada por los datos de la muestra.

El objetivo de una prueba de hipótesis es determinar si existe suficiente evidencia para rechazar la hipótesis nula. Si se rechaza la hipótesis nula, se concluye que la hipótesis alternativa es verdadera.

Pasos para realizar una prueba de hipótesis

Fórmulacion de hipótesis: Se formulan las hipótesis nula y alternativa.
Selección del nivel de significancia: Se selecciona el nivel de significancia, que es la probabilidad de rechazar la hipótesis nula cuando es verdadera. El nivel de significancia se suele establecer en 0,05 o 0,01.
Cálculo del estadístico de prueba: Se calcula un estadístico de prueba, que es una medida de la discrepancia entre los datos observados y la hipótesis nula.
Compara el valor del estadístico de prueba con el valor crítico: Se compara el valor del estadístico de prueba con el valor crítico, que es el valor del estadístico de prueba que se esperaría observar con probabilidad α si la hipótesis nula fuera verdadera.
Toma de una decisión: Si el valor del estadístico de prueba es mayor que el valor crítico, se rechaza la hipótesis nula. Si el valor del estadístico de prueba es menor o igual que el valor crítico, no se rechaza la hipótesis nula.

Tipos de pruebas de hipótesis

Existen diferentes tipos de pruebas de hipótesis, que se clasifican según la naturaleza de los datos y la distribución de la población. Algunos de los tipos más comunes de pruebas de hipótesis son:

Pruebas paramétricas: Se utilizan cuando los datos provienen de una población que sigue una distribución conocida.
Pruebas no paramétricas: Se utilizan cuando los datos no provienen de una población que sigue una distribución conocida.
Pruebas de comparación de medias: Se utilizan para comparar las medias de dos o más poblaciones.
Pruebas de comparación de proporciones: Se utilizan para comparar las proporciones de dos o más poblaciones.

Importancia de las pruebas de hipótesis

Las pruebas de hipótesis son una herramienta importante en la estadística inferencial. Se utilizan para tomar decisiones sobre la base de la evidencia proporcionada por los datos. Las pruebas de hipótesis se utilizan en una amplia gama de campos, incluyendo la ciencia, la ingeniería, la medicina y los negocios

Neicer Vásquez

Estudiante

Aporto algo importante y que en el párrafo 4 indicas lo siguiente:

"El objetivo de una prueba de hipótesis es determinar si existe suficiente evidencia para rechazar la hipótesis nula. Si se rechaza la hipótesis nula, se concluye que la hipótesis alternativa es verdadera."

Pero en realidad esa información no es del todo correcta, ya que al rechazar la hipótesis nula no significa que la hipótesis alternativa sea verdadera, simplemente nos dice que la evidencia está más acorde con la hipótesis alternativa.

Axel Yaguana

Team Platzi

Juan R. Vergara M.

Andres Gutiérrez Castillo

Carlos Mazzaroli

Jhon Freddy Tavera Blandon

Yonatan Efraín Jara Boza

Fernando Jesús Núñez Valdez

Daniel Andres Rojas Paredes

Gabriel Obregón

Iván Alexis Nocua Benitez

JULIO ALEXANDER JAIMES SOCHA

Mario Alexander Vargas Celis

Gonzalo Ceron Denetro

JAKSON VELASQUEZ MUÑOZ

Qué son las pruebas de hipótesis

Fundamentos de estadística inferencial

Estadística inferencial vs descriptiva en IA

Componentes principales de la estadística

Qué es la distribución normal y sus ejemplos

Tipos de muestreo y teorema del límite central

Muestreo aleatorio y sistemático en Python

Muestreo estratificado con pandas en Python

Estadísticos y cálculos

Media muestral vs media poblacional

Varianza poblacional vs muestral en estadística

Varianza y desviación estándar en Python

Qué son los intervalos de confianza

Cómo calcular intervalos de confianza con tabla Z

Intervalos de confianza en Python con SciPy

Pruebas de hipótesis y validación