NumPy
Fundamentos para Análisis de Datos en NumPy y Pandas
Dimensiones en NumPy y Pandas: De Escalares a Tensors
Arrays en NumPy
Introducción al álgebra lineal con NumPy
Indexación y Slicing
Broadcasting y Operaciones Lógicas en NumPy
Elementos Únicos y sus Conteos: Copias y Vistas
Transformación de Arrays: Reshape y Manipulación
Caso Práctico de Análisis de Datos
Cálculos Matriciales en NumPy
Ejercicios en NumPy
Pandas
Pandas para Manipulación de Datos
Creación de Dataframes en Pandas
Estructuras de Datos en Pandas y Funciones
Uso de iloc y loc en Pandas
Manejo de Datos Faltantes en Pandas
Creación y Manipulación de Columnas en Pandas
Agrupaciones con groupby
Filtrado de datos con condiciones en Pandas
Reestructuración de datos: Pivot y Reshape en Pandas
Fusión de DataFrames en Pandas
Manejo de Series Temporales en Pandas
Matplotlib
Introducción a Matplotlib gráfico de líneas y dispersión
Personalización de Gráficos en Matplotlib
Gráficos de Barras y Diagramas de Pastel
Gráficos de Histograma y Boxplot para distribuciones
Series de tiempo y manejo de fechas con Matplotlib
Subplots y Layouts Avanzados
Proyecto de Análisis de Datos de Retail
Caso de Estudio (Parte I). Limpieza de datos
Caso de Estudio (Parte II). Creación de columnas
Caso de Estudio (Parte III). Graficación y análisis de resultados
Proyecto Final: Creación de Portafolio de Análisis de Datos
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Carli Code
Seleccionar datos es una operación fundamental en cualquier análisis de datos. En Pandas, las dos formas más comunes de seleccionar datos son iloc
y loc
.
iloc[]
- Indexación por Enterosiloc
se utiliza para la indexación basada en enteros, permitiendo seleccionar filas y columnas por su posición.
Ejemplos de uso de iloc
:
Seleccionar una fila específica:
import pandas as pd
file_path = "online_retail.csv"
retail_data = pd.read_csv(file_path)
# Seleccionar la primera fila
primera_fila = retail_data.iloc[0]
print("Primera fila:\n", primera_fila)
Seleccionar múltiples filas:
# Seleccionar las primeras cinco filas
primeras_cinco_filas = retail_data.iloc[:5]
print("Primeras cinco filas:\n", primeras_cinco_filas)
Seleccionar una fila y una columna específica:
# Seleccionar el valor en la primera fila y tercera columna
valor = retail_data.iloc[0, 2]
print("Valor en la primera fila y tercera columna:", valor)
Seleccionar múltiples filas y columnas:
# Seleccionar las primeras cinco filas y las primeras tres columnas
subset = retail_data.iloc[:5, :3]
print("Subset de las primeras cinco filas y tres columnas:\n", subset)
loc[]
- Indexación por Etiquetasloc
se utiliza para la indexación basada en etiquetas, permitiendo seleccionar filas y columnas por sus nombres.
Ejemplos de uso de loc
:
Seleccionar una fila específica por su índice:
# Seleccionar la fila con índice 3
fila_indice_3 = retail_data.loc[3]
print("Fila con índice 3:\n", fila_indice_3)
Seleccionar múltiples filas por sus índices:
# Seleccionar filas con índices de 0 a 4
filas_indices_0_a_4 = retail_data.loc[0:4]
print("Filas con índices de 0 a 4:\n", filas_indices_0_a_4)
Nota: Con loc
, el índice final es inclusivo. retail_data.loc[0:4]
selecciona 5 filas, incluyendo la fila con índice 4.
Seleccionar una columna específica por su nombre:
# Seleccionar la columna 'Quantity'
columna_quantity = retail_data.loc[:, 'Quantity']
print("Columna 'Quantity':\n", columna_quantity.head())
Seleccionar múltiples columnas por sus nombres:
# Seleccionar las columnas 'Quantity' y 'UnitPrice'
columnas_quantity_unitprice = retail_data.loc[:, ['Quantity', 'UnitPrice']]
print("Columnas 'Quantity' y 'UnitPrice':\n", columnas_quantity_unitprice.head())
Seleccionar columnas por rango de nombres:
# Seleccionar columnas por rango de nombres
subset_columns = retail_data.loc[:, 'Column1':'Column5']
print("Columnas desde 'Column1' hasta 'Column5':\n", subset_columns.head())
iloc
y loc
iloc
: selecciona datos por posición usando índices enteros.loc
: selecciona datos por etiquetas usando nombres de índices y columnas.iloc
: excluye el último índice en un rango.loc
: incluye el último índice en un rango.iloc
para seleccionar las primeras 10 filas y las primeras 2 columnas del dataset de retail.loc
para seleccionar todas las filas y las columnas ‘Quantity’ y ‘UnitPrice’.iloc
para seleccionar el valor en la quinta fila y la segunda columna.loc
para seleccionar todas las filas donde el país es ‘United Kingdom’ y mostrar las columnas ‘Quantity’ y ‘UnitPrice’.
import pandas as pd
# Leer el dataset de retail desde un archivo CSV
file_path = "online_retail.csv"
retail_data = pd.read_csv(file_path)
# Seleccionar las primeras 10 filas y las primeras 2 columnas utilizando iloc
subset_iloc = retail_data.iloc[:10, :2]
print("Primeras 10 filas y 2 columnas utilizando iloc:\n", subset_iloc)
# Seleccionar todas las filas y las columnas 'Quantity' y 'UnitPrice' utilizando loc
subset_loc = retail_data.loc[:, ['Quantity', 'UnitPrice']]
print("Columnas 'Quantity' y 'UnitPrice' utilizando loc:\n", subset_loc.head())
# Seleccionar el valor en la quinta fila y la segunda columna utilizando iloc
valor_iloc = retail_data.iloc[4, 1]
print("Valor en la quinta fila y segunda columna utilizando iloc:", valor_iloc)
# Seleccionar todas las filas donde el país es 'United Kingdom' y mostrar las columnas 'Quantity' y 'UnitPrice' utilizando loc
subset_uk = retail_data.loc[retail_data['Country'] == 'United Kingdom', ['Quantity', 'UnitPrice']]
print("Filas de 'United Kingdom' con columnas 'Quantity' y 'UnitPrice' utilizando loc:\n", subset_uk.head())
Aportes 13
Preguntas 0
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?