NumPy
Fundamentos para Análisis de Datos en NumPy y Pandas
Dimensiones en NumPy y Pandas: De Escalares a Tensors
Arrays en NumPy
Introducción al álgebra lineal con NumPy
Indexación y Slicing
Broadcasting y Operaciones Lógicas en NumPy
Elementos Únicos y sus Conteos: Copias y Vistas
Transformación de Arrays: Reshape y Manipulación
Caso Práctico de Análisis de Datos
Cálculos Matriciales en NumPy
Ejercicios en NumPy
Pandas
Pandas para Manipulación de Datos
Creación de Dataframes en Pandas
Estructuras de Datos en Pandas y Funciones
Uso de iloc y loc en Pandas
Manejo de Datos Faltantes en Pandas
Creación y Manipulación de Columnas en Pandas
Agrupaciones con groupby
Filtrado de datos con condiciones en Pandas
Reestructuración de datos: Pivot y Reshape en Pandas
Fusión de DataFrames en Pandas
Manejo de Series Temporales en Pandas
Matplotlib
Introducción a Matplotlib gráfico de líneas y dispersión
Personalización de Gráficos en Matplotlib
Gráficos de Barras y Diagramas de Pastel
Gráficos de Histograma y Boxplot para distribuciones
Series de tiempo y manejo de fechas con Matplotlib
Subplots y Layouts Avanzados
Proyecto de Análisis de Datos de Retail
Caso de Estudio (Parte I). Limpieza de datos
Caso de Estudio (Parte II). Creación de columnas
Caso de Estudio (Parte III). Graficación y análisis de resultados
Proyecto Final: Creación de Portafolio de Análisis de Datos
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Carli Code
Vamos a explorar cómo crear gráficos de líneas utilizando la biblioteca matplotlib
en Python.
El objetivo es visualizar la relación entre las horas estudiadas y los puntajes obtenidos por dos estudiantes en un examen. A lo largo de este ejercicio, aprenderás a configurar el tamaño del gráfico, trazar múltiples series de datos, personalizar las líneas y marcadores, y agregar anotaciones para destacar puntos importantes en la visualización.
También existe personalizaciones que podemos hacer con la escala que se maneja en X y Y o si queremos apuntar a algún punto específico como vemos en el siguiente ejercicio
import matplotlib.pyplot as plt
plt.figure(figsize=(8,6))
hours = [2,3,4,5,6,7,8]
exam_scores_student_1 = [55, 60, 65, 70, 75, 80, 85]
exam_scores_student_2 = [50, 58, 63, 69, 74, 78, 83]
plt.plot(hours, exam_scores_student_1, marker='o', color='green', linestyle='-', linewidth = 2 , label = 'Estudiante 1')
plt.plot(hours, exam_scores_student_2, marker='s', color='red', linestyle='--',linewidth = 2, label = 'Estudiante 2')
# Añadir anotación en un punto específico
plt.annotate('Mejora significativa', xy=(5, 70), xytext=(6, 60),
arrowprops=dict(facecolor='black', shrink=0.05))
# Escalar los ejes para ajustar mejor los datos
plt.ylim(50, 90) # Escala del eje y
plt.xlim(0, 8) # Escala del eje x
plt.title('Relación entre horas estudiadas y el puntaje de dos estudiantes')
plt.xlabel('Horas')
plt.ylabel('Puntaje')
#Añadir la leyenda de explicación
plt.legend()
plt.show()
y
se limita a un rango de 50 a 90 puntos y el eje x
de 2 a 8 horas, para enfocar mejor la visualización en los datos relevantes.Este ejercicio demuestra cómo matplotlib
puede ser una herramienta poderosa para visualizar datos de manera efectiva. Al personalizar los gráficos con anotaciones y ajustes de escala, podemos resaltar tendencias y puntos clave en los datos, facilitando así su interpretación.
Aportes 7
Preguntas 0
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?