Cursos Empresas Blog Live Conf Precios

Contenido del curso

No sé dónde empezar

Fundamentos de estadística inferencial

Estadísticos y cálculos

Pruebas de hipótesis y validación

Cierre del curso

22
Estadística aplicada a ciencia de datos
01:28 min

Estadística descriptiva vs inferencial en datos

Resumen

La estadística inferencial es la rama que te permite ir más allá de describir datos: con ella predices, validas hipótesis y sacas conclusiones sobre poblaciones completas a partir de muestras. Si trabajas en ciencia de datos o inteligencia artificial, es la base para construir modelos confiables y tomar decisiones con respaldo numérico.

¿Qué diferencia hay entre estadística descriptiva e inferencial?

La distinción es más práctica de lo que parece. La descriptiva te muestra cómo se comportan los datos hoy; la inferencial te ayuda a anticipar lo que viene.

En la descriptiva limpias datos, calculas índices y observas el presente. Revisas la tendencia de una variable, su variabilidad o dispersión, y su distribución (si es unimodal o bimodal). Ahí aparecen los estadísticos clásicos: media, mediana y moda [2:00].

En la inferencial das un salto. Partes de una población, extraes una muestra y sobre esa muestra haces preguntas. Aprendes técnicas de muestreo, calculas intervalos de confianza, validas hipótesis y aplicas métodos para evitar sesgos [2:30].

¿Qué es la estadística inferencial? Es el proceso de sacar conclusiones sobre una población completa usando los parámetros de una muestra, midiendo además qué tan confiables son esos resultados.

¿Para qué sirve la estadística inferencial en machine learning?

Cuando entrenas modelos, no basta con describir lo que ya pasó. Necesitas saber si tus conclusiones son sólidas y si tu modelo generaliza bien.

La inferencia estadística te permite cuatro cosas concretas dentro de un flujo de ciencia de datos:

Entender la distribución de la información y cómo se comportan tus variables.
Crear y validar hipótesis sobre tus datos para confirmar o descartar teorías.
Diseñar experimentos y comprobar si los resultados son significativos.
Construir modelos predictivos y medir la precisión de sus conclusiones [3:30].

Este enfoque también te dice cuándo un modelo no está funcionando. Si el grado de fiabilidad es bajo, sabes que toca recalcular en lugar de seguir adelante con resultados débiles.

¿Qué es una muestra en estadística inferencial? Es un subconjunto representativo extraído de una población más grande, sobre el cual aplicas técnicas de muestreo para inferir características del total.

¿Qué necesitas saber antes de empezar el curso?

Este curso forma parte de la ruta de la Escuela de Inteligencia Artificial y Ciencia de Datos, así que conviene llegar con bases firmes para aprovecharlo.

Los requisitos previos son claros:

Manejar estadística descriptiva en Python.
Conocer librerías como NumPy, Pandas, Matplotlib y Seaborn.
Haber completado los cursos anteriores de tu ruta de aprendizaje [0:30].

¿Qué temas vas a ver durante el curso?

La profesora Silvia Arisa Sentís, científica de datos con experiencia en banca, aerolíneas y aplicaciones de movilidad en España y México, organiza el contenido alrededor de los pilares de la inferencia.

Verás técnicas de muestreo, intervalos de confianza para sacar deducciones cuantificables, validación de hipótesis para poner a prueba teorías con tus datos, y estrategias para evitar sesgos que distorsionen los resultados [2:30].

¿Cuándo conviene usar inferencia en lugar de descriptiva? Cuando tu objetivo deja de ser describir lo que ya ocurrió y pasa a predecir, validar una hipótesis o generalizar resultados a una población más grande.

En la siguiente clase arrancas con los estadísticos principales, que serán la base para todo lo que construyas después. ¿Qué pregunta te gustaría resolver con tus datos usando inferencia? Déjala en los comentarios.

ESTADISTICA INFERENCIAL VS DESCRIPTIVA EN MACHING LEARNING

**** La estadística inferencial y la descriptiva son dos ramas de la estadística que se utilizan para analizar datos. La estadística descriptiva se centra en describir los datos, mientras que la estadística inferencial se centra en hacer inferencias sobre la población a partir de los datos.

En el contexto del aprendizaje automático, la estadística descriptiva se utiliza para:

Describir la distribución de los datos: La estadística descriptiva se puede utilizar para calcular estadísticas descriptivas, como la media, la mediana, la desviación estándar, etc. Estas estadísticas pueden proporcionar información sobre la distribución de los datos y pueden utilizarse para identificar patrones y tendencias.
Preparar los datos para el aprendizaje automático: La estadística descriptiva se puede utilizar para identificar valores atípicos y para transformar los datos para que sean más adecuados para el aprendizaje automático.

La estadística inferencial se utiliza en el aprendizaje automático para:

Validar modelos: La estadística inferencial se puede utilizar para evaluar la precisión de los modelos de aprendizaje automático. Esto se puede hacer mediante la realización de pruebas de hipótesis o mediante la construcción de intervalos de confianza.
Elegir modelos: La estadística inferencial se puede utilizar para comparar diferentes modelos de aprendizaje automático y para elegir el modelo que mejor se adapte a los datos.

En general, la estadística descriptiva es una herramienta esencial para el análisis de datos en el aprendizaje automático. La estadística inferencial es importante para la validación y la selección de modelos.

Aquí hay algunos ejemplos específicos de cómo se pueden utilizar la estadística descriptiva e inferencial en el aprendizaje automático:

Estadística descriptiva

Una empresa de telecomunicaciones puede utilizar la estadística descriptiva para calcular la media y la desviación estándar del tiempo de respuesta de sus servicios. Esto les permite identificar problemas potenciales con sus servicios.
Un banco puede utilizar la estadística descriptiva para identificar los factores que predicen la probabilidad de que un cliente se atrase en sus pagos. Esto les permite tomar decisiones informadas sobre la concesión de préstamos.

Estadística inferencial

Un científico puede utilizar la estadística inferencial para realizar una prueba de hipótesis para determinar si la media de una población es diferente de un valor especificado.
Un ingeniero puede utilizar la estadística inferencial para construir un intervalo de confianza para la precisión de un modelo de aprendizaje automático. Esto les permite estimar la probabilidad de que el modelo haga una predicción correcta.