- 1

Análisis de Datos con NumPy y Pandas en Python
03:32 - 2

Manipulación de Dimensiones en Arrays NumPy para Ciencia de Datos
12:05 - 3

Manipulación de Arrays NumPy para Análisis de Datos en Python
08:41 - 4
Álgebra Lineal Aplicada con NumPy: Operaciones y Ejemplos Prácticos
02:58 - 5

Indexación y Slicing en NumPy para Análisis de Datos
09:34 - 6

Operaciones con Arrays en NumPy: Broadcasting, Concatenación y Más
12:30 - 7

Identificación y conteo de respuestas únicas con NumPy
07:46 - 8

Manipulación de Matrices y Arrays en NumPy: Transponer, Invertir y Aplanar
07:07 - 9

Análisis de Ventas Mensuales con NumPy: Transformaciones y Insights
01:25 - 10

Operaciones de Álgebra Lineal con NumPy en Python
05:54 - 11
Conexión de NumPy con Pandas y Matplotlib para Análisis de Datos
03:20
Gráficos Básicos en Python con Matplotlib: Líneas y Dispersión
Clase 23 de 32 • Curso de Python para Ciencia de Datos
Contenido del curso
- 12

Análisis de Datos con Pandas: Carga y Exploración de DataFrames
09:21 - 13

Creación de DataFrames con Pandas en Python
14:06 - 14

Análisis de Datos con Pandas: Series y DataFrames en RetailData
11:22 - 15

Selección de Datos en Pandas: Uso de iLoc y loc
08:15 - 16

Manejo de Datos Faltantes en Pandas: Identificación y Tratamiento
11:19 - 17

Transformaciones y Manipulación de Datos con Pandas en Python
11:13 - 18

Análisis de Ventas con Pandas: Agrupaciones y Estadísticas
09:23 - 19

Filtrado de Datos en Pandas para Análisis Efectivo
12:27 - 20

Creación y manejo de Pivot Tables en pandas
07:07 - 21

Fusión de DataFrames con Pandas: merge, concat y join
12:10 - 22

Análisis de Series Temporales en Ventas Retail
15:46
- 23

Gráficos Básicos en Python con Matplotlib: Líneas y Dispersión
10:44 - 24

Personalización Avanzada de Gráficos en Matplotlib
06:46 - 25

Creación y Personalización de Gráficos con Matplotlib
12:32 - 26

Creación y personalización de histogramas y boxplots con Matplotlib
12:24 - 27

Visualización de Series Temporales con Python: Matplotlib y Pandas
15:22 - 28

Creación de Gráficos Combinados en Matplotlib con GridSpec
15:00
¿Por qué Matplotlib es una herramienta esencial para el análisis de datos?
Matplotlib se ha consolidado como una de las bibliotecas más esenciales para la visualización de datos en Python. Desde su creación en 2003 por John D. Hunter, se ha convertido en el estándar para gráficos de alta calidad en disciplinas que van desde la ciencia hasta las finanzas. Este robusto conjunto de herramientas permite a los analistas de datos y científicos del ámbito tecnológico no solo presentar la información de manera visual, sino también explorar complejas relaciones dentro de los datos, facilitando análisis más profundos. Además, su integración con bibliotecas como NumPy y Pandas simplifica el análisis y presentación de datos de diversas maneras.
¿Cómo instalar y configurar Matplotlib?
Aunque trabajamos en Google Collaboratory, donde Matplotlib ya viene preinstalado, es útil recordar cómo se puede instalar utilizando la herramienta pip, especialmente si estás trabajando en entornos virtuales o en Visual Studio Code. La instalación se realiza con el comando:
pip install matplotlib
Este comando asegura que la biblioteca esté disponible para ser utilizada, lo que es crucial si estás trabajando en un entorno que no sea Google Collaboratory.
¿Cómo crear gráficos básicos con Matplotlib?
Gráfico de líneas
Los gráficos de líneas son usualmente utilizados para mostrar tendencias a lo largo del tiempo o cambios continuos en los datos. Para comenzar, es necesario importar NumPy y Matplotlib, específicamente el módulo PyPlot.
import numpy as np
import matplotlib.pyplot as plt
Supongamos que queremos graficar las ventas mensuales de un producto. Podrías crear los datos de los meses y las ventas de la siguiente manera:
meses = np.array(['E', 'F', 'M', 'A', 'M'])
ventas = np.array([20, 25, 30, 28, 35])
Con los datos listos, configuramos y mostramos el gráfico:
plt.figure(figsize=(8, 6))
plt.plot(meses, ventas, marker='o', color='blue')
plt.title('Ventas mensuales de un producto')
plt.xlabel('Meses')
plt.ylabel('Ventas (en miles de unidades)')
plt.show()
Esta representación visual nos permite identificar patrones o estacionalidades que podrían ser relevantes para decisiones de negocio.
Gráfico de dispersión
Un gráfico de dispersión es ideal para visualizar la relación entre dos variables. Por ejemplo, podrías estar interesado en saber cómo la cantidad de horas estudiadas afecta el rendimiento en un examen. De esta forma, podrías estructurar tus datos en listas:
horas_estudio = [1, 2, 3, 4, 5, 6, 7, 8]
puntaje_examen = [55, 60, 65, 70, 75, 80, 85, 90]
Para crear y mostrar el gráfico de dispersión:
plt.figure(figsize=(8, 6))
plt.scatter(horas_estudio, puntaje_examen, color='green')
plt.title('Relación entre horas estudiadas y el puntaje')
plt.xlabel('Horas de estudio')
plt.ylabel('Puntaje del examen')
plt.show()
Este gráfico es vital para detectar si existe una correlación positiva o negativa entre las variables en estudio, lo cual es útil en estudios experimentales o correlacionales.
¿Qué seguir después de los gráficos básicos?
Con los fundamentos de los gráficos de línea y dispersión cubiertos, el próximo paso es personalizar estos gráficos. Personalizaciones como el ajuste de ejes, el uso de estilos de marcador diferentes, y la inclusión de leyendas o texturas pueden mejorar la claridad y efectividad de la visualización. Esta personalización mejora la precisión y percepción de los datos, habilidades que desarrollaremos aún más en clases posteriores.
En resumen, Matplotlib es una herramienta poderosa para dar vida a los datos de diferentes sectores, y con cada sesión de práctica, tu habilidad para presentar visualmente se profundizará. ¡Continúa practicando y personalizando!