Análisis de Datos de Ventas con Python y Statistics

Clase 35 de 63Curso de Python

Resumen

En el análisis de datos, es fundamental comprender y utilizar diversas medidas estadísticas para interpretar correctamente la información. Estas medidas nos permiten resumir y describir las características principales de un conjunto de datos, facilitando la toma de decisiones informadas. Algunas de las medidas estadísticas más comunes y sus fórmulas asociadas son las siguientes:

1. Media (Promedio)

La media aritmética se calcula sumando todos los valores de un conjunto de datos y dividiendo entre la cantidad de valores.

Captura de pantalla 2024-08-28 a la(s) 3.46.21 p.m..png

Donde:

  • nnn es el número total de valores.
  • xix_ixi representa cada valor individual en el conjunto de datos.

2. Mediana

La mediana es el valor que separa la mitad superior de la mitad inferior de un conjunto de datos ordenado.

  • Si n (el número de observaciones) es impar, la mediana es el valor en la posición 2n+1 después de ordenar los datos.
Captura de pantalla 2024-08-28 a la(s) 3.46.33 p.m..png

Si n es par, la mediana es el promedio de los dos valores centrales, es decir:

Captura de pantalla 2024-08-28 a la(s) 3.46.37 p.m..png

3. Moda

La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. No hay una fórmula específica para la moda; se determina contando la frecuencia de cada valor y eligiendo el que tiene la frecuencia más alta.

Captura de pantalla 2024-08-28 a la(s) 3.46.42 p.m..png

4. Desviación Estándar

La desviación estándar mide la dispersión de los datos en relación con la media. Se calcula como la raíz cuadrada de la varianza.

Captura de pantalla 2024-08-28 a la(s) 3.46.46 p.m..png

Donde:

  • μ\muμ es la media de los datos.
  • xix_ixi representa cada valor individual.
  • nnn es el número total de valores.

5. Varianza

La varianza es el promedio de los cuadrados de las diferencias entre cada valor y la media del conjunto de datos.

Captura de pantalla 2024-08-28 a la(s) 3.46.51 p.m..png

6. Máximo y Mínimo

  • Máximo (max(x)): Es el valor más alto en un conjunto de datos.

    max⁡(x)\max(x)

  • Mínimo (min(x)): Es el valor más bajo en un conjunto de datos.

    min⁡(x)\min(x)

Captura de pantalla 2024-08-28 a la(s) 3.46.55 p.m..png

7. Rango

El rango es la diferencia entre el valor máximo y el valor mínimo en un conjunto de datos.

Captura de pantalla 2024-08-28 a la(s) 3.46.59 p.m..png

Estas fórmulas matemáticas te permiten realizar un análisis estadístico básico de cualquier conjunto de datos, como las ventas mensuales en un negocio, y son fundamentales para extraer conclusiones y tomar decisiones basadas en datos.

Al aplicar estas medidas, podrás extraer conclusiones valiosas y tomar decisiones basadas en datos, lo que es crucial para el éxito en diversos campos, desde la investigación científica hasta la gestión empresarial.