Comprender cómo se clasifican los datos es el primer paso para interpretar cualquier fenómeno con rigor. Sin distinguir entre un individuo y una variable, o entre una medida nominal y una de proporción, cualquier análisis pierde sentido. Aquí se desglosan los fundamentos que sostienen todo el trabajo estadístico: desde la organización en tablas hasta la diferencia entre estadística descriptiva e inferencial.
¿Qué son los individuos y las variables en estadística?
Cuando se recopilan datos, lo primero es identificar a quién o a qué se está estudiando. Esos sujetos de estudio se denominan individuos y no tienen que ser personas necesariamente. Pueden ser maletas, sabores de helado, equipos de fútbol o medicamentos [1:38]. Cada característica que se registra de esos individuos recibe el nombre de variable.
Por ejemplo, al medir la estatura de cinco amigos —Tania, Damián, Michelle, Gilberto y Laura— los individuos son las personas y la variable es la estatura en centímetros [1:08]. Presentar esos datos sueltos genera ruido; por eso se organizan en una tabla de datos, donde cada fila representa un individuo y cada columna una variable.
¿Cómo se distinguen las variables cuantitativas de las cualitativas?
Las variables cuantitativas (o numéricas) son aquellas cuyos valores se expresan con números y permiten realizar cálculos: sumas, promedios, máximos y mínimos [2:28]. Dentro de ellas hay dos subtipos:
- Discretas: toman valores enteros que se pueden contar. Vender "media maleta" no tiene sentido; las maletas vendidas son un ejemplo claro [3:08].
- Continuas: admiten valores decimales. La estatura de una persona puede ser 1.68 m, 1.72 m o incluso 1.999999 m [3:24].
Las variables cualitativas (o categóricas) describen características no numéricas de los individuos, como el color de una maleta o si tiene rueditas [2:50]. También se dividen en dos:
- Nominales: no siguen ningún orden. Decir que el cabello es negro o que la ropa es gris no implica jerarquía [3:52].
- Ordinales: poseen un orden implícito. La temperatura clasificada como fría, templada o caliente lleva una secuencia lógica [4:04].
¿Cuáles son los niveles de medida y por qué importan?
Los niveles de medida funcionan como una clasificación más fina de los valores que toman las variables [4:18]. Conocerlos ayuda a elegir las herramientas de análisis correctas.
- Nominal: los valores solo etiquetan. Responder "sí" o "no" a si una maleta tiene rueditas no implica orden alguno [4:38].
- Ordinal: los valores siguen una secuencia. Ganadores de una competencia (primero, segundo, tercero) o niveles de temperatura son ejemplos directos [5:00].
- De intervalo: los valores son numéricos, equidistantes entre sí y pueden ser positivos o negativos. La temperatura en grados es el caso típico: existen grados bajo cero [5:22].
- De proporción: similar al de intervalo, pero el cero es absoluto y los valores negativos carecen de sentido. Una estatura menor a cero no existe, lo mismo ocurre con el peso o el ahorro [5:48].
¿Por qué el piso de un edificio puede ser una variable cualitativa?
Un caso que genera confusión es el piso de un departamento [6:38]. Aunque se piensa en números (piso 3, piso 7), muchos edificios incluyen planta baja, estacionamiento, penthouse o roof garden. Eso convierte al piso en una variable cualitativa ordinal, porque existe una jerarquía que incluso puede influir en el precio del inmueble.
Cuando una tabla tiene más variables que individuos, conviene invertir la disposición: colocar las variables en filas y los individuos en columnas para facilitar la lectura [6:18].
¿Qué diferencia a la estadística descriptiva de la inferencial?
La estadística descriptiva utiliza tablas y gráficos para organizar, resumir y representar visualmente un conjunto de datos, permitiendo extraer conclusiones directas [7:10]. Es el enfoque central cuando se trabaja con todos los datos disponibles.
La estadística inferencial, en cambio, parte de una muestra para generalizar características hacia una población completa [7:28]. Si se quisiera conocer un rasgo de todo un país, sería inviable recopilar datos de cada habitante; por eso se selecciona una muestra representativa y se infiere a partir de ella.
Dominar estos fundamentos —individuos, variables, niveles de medida y tipos de estadística— prepara el terreno para aplicar las herramientas de análisis con criterio. ¿Se te ocurre un ejemplo propio de cada nivel de medida? Compártelo en los comentarios.