Contenido del curso
Una imagen vale más que mil datos
Estadística descriptiva
- 8

Distribuciones conjuntas en tablas dinámicas
08:26 min - 9

Medidas de Tendencia Central: Media, Mediana y Moda
13:49 min - 10

Media, mediana y moda en Excel con videojuegos
05:20 min - 11

Rango e índice intercuartílico en Excel
12:07 min - 12

Desplazamiento y escala en tus datos
08:31 min - 13

Cómo construir un boxplot paso a paso
06:47 min
Representación de datos
Muestra y error
¿Y la probabilidad?
- 19

Probabilidad simple vs experimental con dados y cartas
07:27 min - 20

Regla de la Suma en Probabilidad: Unión e Intersección de Eventos
10:45 min - 21

Eventos dependientes e independientes en probabilidad
06:29 min - 22

Teorema de Bayes con dados y fórmula
13:28 min - 23

Permutación vs combinación con cartas
03:19 min
Correlación y causalidad
Conclusiones
Tablas unidimensionales vs bidimensionales en datos
Resumen
Organizar datos en tablas parece simple hasta que aparece una segunda variable y todo se complica. Aquí aprenderás a diferenciar tablas unidimensionales y bidimensionales, cuándo usar cada una y cómo aplicarlo a un dataset real de Netflix en Google Sheets.
¿Qué define a una tabla unidimensional?
Una tabla unidimensional es aquella en la que te basta una sola pregunta sobre una variable para encontrar el valor que buscas. Piensa en las ventas mensuales de una tienda entre 2018 y 2021: si solo te interesa saber cuál fue el mes con más ganancias acumuladas, te responde una tabla con doce filas, una por mes.
En ese ejemplo, noviembre lidera el acumulado de los cuatro años. La estructura es plana porque la respuesta depende únicamente del mes, sin cruzar con ninguna otra dimensión.
¿Qué es una tabla unidimensional? Es una tabla donde una sola variable basta para encontrar el dato. Si tu pregunta tiene una sola condición (por ejemplo, ventas por mes), estás frente a una tabla unidimensional.
¿Cuándo necesitas una tabla bidimensional?
Cuando tu pregunta involucra dos variables al mismo tiempo, una tabla plana se queda corta. Si quieres saber en qué año de noviembre se vendió más, ya estás cruzando mes y año, y necesitas una estructura con filas y columnas que combinen ambas dimensiones.
Al ampliar la tabla original para incluir cada uno de los cuatro años, puedes identificar que noviembre de 2021 fue el mes con mayor cantidad de ventas. Y al graficarlo aparecen patrones extra: noviembre mantiene la tendencia más alta cada año, mientras mayo y junio estuvieron bajos entre 2018 y 2020 hasta repuntar en 2021.
¿Cómo conviven ambas en la misma hoja?
Una tabla bidimensional puede contener tablas unidimensionales dentro. Si agregas una columna con el total por mes y una fila con el total por año, esos totales son tablas unidimensionales independientes:
- El total por mes solo depende del mes.
- El total por año solo depende del año.
- El cruce mes y año sigue siendo bidimensional.
Esto es útil porque puedes responder distintos niveles de pregunta sin cambiar de archivo.
¿Cómo saber qué tipo de tabla tienes enfrente?
La regla práctica es contar preguntas. Si necesitas una sola pregunta para llegar al dato, la tabla es unidimensional. Si necesitas dos, es bidimensional.
Por ejemplo, ¿cuáles fueron las ventas totales de enero? se resuelve con una variable. En cambio, ¿cuáles fueron las ventas de noviembre? obliga a repreguntar: ¿en total o de qué año? Esa segunda pregunta delata que el dato vive en una estructura bidimensional.
¿Cuál es la diferencia entre tabla unidimensional y bidimensional? La unidimensional responde con una variable; la bidimensional necesita cruzar dos. Cuenta cuántas preguntas haces para llegar al dato y tendrás la respuesta.
¿Qué dataset usaremos en el proyecto?
El archivo de trabajo está en Google Sheets, aunque puedes abrirlo en Excel o Numbers según tu preferencia. Google Sheets tiene la ventaja de ser gratuito y vivir en la nube.
En la parte inferior del archivo hay varias hojas, cada una pensada para una clase específica como frecuencias o visualizaciones. La hoja principal contiene un catálogo de películas y series de Netflix con campos como:
- Título de la película o serie.
- Director.
- Número de actores que participaron.
- Fecha de estreno en la plataforma.
- Año de lanzamiento.
Dale un vistazo y revisa si reconoces algún título o actor favorito antes de avanzar.
¿Por qué importa distinguir el tipo de tabla?
Identificar correctamente la dimensión de tu tabla te ahorra tiempo al consultar datos y evita errores al construir gráficos o reportes. Si confundes una bidimensional con una unidimensional, terminas resumiendo información que en realidad necesitabas desagregar.
Recuerda el ejemplo de las ventas: una tabla unidimensional respondía solo por mes; la bidimensional cruzaba mes con año y revelaba que noviembre de 2021 era el pico real.
Como reto, déjame en los comentarios si crees que la tabla del proyecto de Netflix es unidimensional o bidimensional. Cuéntame tus argumentos y nos vemos en la próxima clase.