Consultas en DynamoDB: Optimización y Uso Eficiente de Queries

Curso Práctico de Bases de Datos en AWS

Contenido del curso

Introducción

1
Bases de Datos Relacionales y No Relacionales en AWS
00:43 min

Introducción a RDS

Backups, Performance y HA en RDS

Migración a RDS

Aurora

Introducción a DynamoDB

Particiones e Índices en DynamoDB

DynamoDB Streams y Replicación

Contenido Bonus

32
Bases de Datos Relacionales y No Relacionales en AWS
08:10 min

Tomar examen

Consultas en DynamoDB: Optimización y Uso Eficiente de Queries

Resumen

Las Operaciones Query (operaciones de consulta) nos permiten buscar elementos en cualquier tabla o índice secundario en base a su clave principal compuesta para optimizar la petición.

En vez de escanear toda la tabla (como en las operaciones Scan), vamos a especificar los criterios de búsqueda utilizando una expresión de condición clave (una cadena que determina los elementos que vamos a leer en la tabla o el índice), especificamos el nombre y valor la clave de partición como una condición de igualdad, podemos realizar consultas utilizando diferentes operadores para encontrar los resultados con mejor precisión.

También podemos limitar el número de elementos que esperamos en los resultados para agilizar las operaciones, pero no obtenemos información tan detallada de la capacidad de lectura que consumimos.

El desafío de esta clase es responder en la sección de comentarios un caso de uso de DynamoDB y cuáles serian sus ventajas frente a los servicios RDS.

Mario Alexander Vargas Celis

Estudiante

📌 Operaciones Query en Amazon DynamoDB

Amazon DynamoDB es una base de datos NoSQL diseñada para manejar datos con acceso rápido y escalable. Una de las formas más eficientes de recuperar datos es mediante la operación Query, que permite buscar elementos con base en la clave de partición y, opcionalmente, la clave de ordenación.

1️⃣ ¿Qué es Query en DynamoDB?

Query se usa para recuperar elementos rápidamente usando el índice primario o un índice secundario (GSI o LSI).

🔹 Diferencias clave entre Scan y Query

OperaciónDescripciónEficienciaScanRecorre toda la tabla, aplicando un filtro opcional.🚨 Ineficiente en tablas grandes.QueryBusca por clave de partición (PK) y opcionalmente por clave de ordenación (SK).🚀 Rápida y optimizada.

📌 Siempre que sea posible, usa Query en lugar de Scan para mejorar el rendimiento.

2️⃣ Ejecutando un Query en DynamoDB

Para ejecutar una consulta con Query, necesitamos conocer:

✅ Clave de Partición (PK): Obligatoria. ✅ Clave de Ordenación (SK): Opcional, pero permite búsquedas más refinadas.

Ejemplo de Query

Supongamos que tenemos la siguiente tabla Pedidos con las claves:

pedido_id (PK)fecha (SK)clientemontoP0012025-03-10Juan100 USDP0012025-03-12Juan150 USDP0022025-03-11Ana200 USD

🔹 Consultar los pedidos de "P001"

import boto3

dynamodb = boto3.resource('dynamodb') table = dynamodb.Table('Pedidos')

response = table.query( KeyConditionExpression="pedido_id = :pedido", ExpressionAttributeValues={":pedido": "P001"} )

items = response['Items'] print(items)

📌 Salida esperada:

[ {"pedido_id": "P001", "fecha": "2025-03-10", "cliente": "Juan", "monto": 100}, {"pedido_id": "P001", "fecha": "2025-03-12", "cliente": "Juan", "monto": 150} ]

🔹 ¿Qué está pasando aquí?

Se está buscando todos los elementos donde pedido_id = 'P001'.
DynamoDB devuelve solo esos registros, sin escanear toda la tabla.

3️⃣ Filtrando resultados en Query

Podemos agregar condiciones en la clave de ordenación (SK) o en otros atributos con filtros.

✅ 1. Usar operadores en la SK (rango de fechas)

Si queremos pedidos después del 2025-03-11:

response = table.query( KeyConditionExpression="pedido_id = :pedido AND fecha >= :fecha", ExpressionAttributeValues={ ":pedido": "P001", ":fecha": "2025-03-11" } )

📌 Salida esperada:

[ {"pedido_id": "P001", "fecha": "2025-03-12", "cliente": "Juan", "monto": 150} ]

✅ 2. Filtrar por atributos secundarios (FilterExpression)

Si queremos pedidos de P001 con monto mayor a 120 USD:

response = table.query( KeyConditionExpression="pedido_id = :pedido", FilterExpression="monto > :monto", ExpressionAttributeValues={ ":pedido": "P001", ":monto": 120 } )

📌 Salida esperada:

[ {"pedido_id": "P001", "fecha": "2025-03-12", "cliente": "Juan", "monto": 150} ]

❗ IMPORTANTE:

FilterExpression NO reduce el número de elementos escaneados, solo filtra después de la búsqueda.
Es más eficiente hacer búsquedas con KeyConditionExpression.

4️⃣ Ordenamiento y Paginación en Query

✅ 1. Orden Ascendente o Descendente

Por defecto, DynamoDB ordena los resultados en orden ascendente por la clave de ordenación (SK).

Si queremos orden descendente:

response = table.query( KeyConditionExpression="pedido_id = :pedido", ExpressionAttributeValues={":pedido": "P001"}, ScanIndexForward=False # Activa el orden descendente )

📌 Salida esperada (ordenado de más reciente a más antiguo):

[ {"pedido_id": "P001", "fecha": "2025-03-12", "cliente": "Juan", "monto": 150}, {"pedido_id": "P001", "fecha": "2025-03-10", "cliente": "Juan", "monto": 100} ]

✅ 2. Paginación con LastEvaluatedKey

Si la consulta devuelve más de 1 MB de datos, DynamoDB paginará los resultados.

items = [] response = table.query( KeyConditionExpression="pedido_id = :pedido", ExpressionAttributeValues={":pedido": "P001"} )

while "LastEvaluatedKey" in response: items.extend(response['Items']) response = table.query( KeyConditionExpression="pedido_id = :pedido", ExpressionAttributeValues={":pedido": "P001"}, ExclusiveStartKey=response["LastEvaluatedKey"] )

print(items)

📌 Beneficio: Se puede manejar grandes volúmenes de datos sin bloquear la memoria.

5️⃣ Query en Índices Secundarios

Si queremos consultar por un atributo que no es la clave de partición, podemos usar: ✅ Índices Secundarios Locales (LSI) → Misma PK, diferente SK. ✅ Índices Secundarios Globales (GSI) → Diferente PK y SK.

Ejemplo: Si la tabla Pedidos tiene un GSI con cliente como PK y fecha como SK, podemos buscar todos los pedidos de un cliente:

response = table.query( IndexName="ClienteIndex", KeyConditionExpression="cliente = :cliente", ExpressionAttributeValues={":cliente": "Juan"} )

📌 Beneficio: Permite búsquedas rápidas sin escanear la tabla principal.

📌 Conclusión

✅ Usa Query siempre que sea posible, ya que es mucho más eficiente que Scan. ✅ Aprovecha los índices secundarios (GSI y LSI) para optimizar búsquedas sin usar Scan. ✅ Filtra con KeyConditionExpression en lugar de FilterExpression para reducir la cantidad de elementos escaneados. ✅ Usa paginación con LastEvaluatedKey si la consulta devuelve muchos resultados. ✅ Ordena con ScanIndexForward=False si necesitas datos en orden descendente.

Geovany Uribe Aguirre

Arturo García

Jose Suarez

Cristian David Montoya Montoya

Camilo Ortegón

Usuario anónimo

User

Jenny Aguilar

Enzo Aliatis

OBED ENRIQUE MACALLUMS RUIZ

Carlos Andrés Zambrano Barrera

Profesor

Flavio Andres Pareja Torres

Patricio Sánchez Fernández

Jose Hernández

Dam Castle

jhon Erik calderon Rubiano

Ixcoatl Francisco Pérez

Pablo Antipan Quiñenao

Bryan Castano

Jeisson Espinosa

Rafael reyes

Consultas en DynamoDB: Optimización y Uso Eficiente de Queries

Introducción

Bases de Datos Relacionales y No Relacionales en AWS

Introducción a RDS

Gestión de Bases de Datos Relacionales en AWS RDS

Creación de Bases de Datos en AWS RDS con MySQL

Conexión y Gestión de Bases de Datos MySQL con MySQL Workbench

Creación de Tablas e Ingesta de Datos con MySQL Workbench

Conexión y Operaciones en RDS con Instancia EC2 de Amazon

Despliegue y Gestión de Bases de Datos RDS con MySQL

Backups, Performance y HA en RDS

Backups y Alta Disponibilidad en RDS: Estrategias Efectivas

Restauración y Configuración de Backups en RDS

Estrategias de Rendimiento en Bases de Datos AWS RDS

Alta Disponibilidad en RDS con Multi-AZ

Migración a RDS

Estrategias de Migración a RDS con Database Migration Service

Migraciones Homogéneas con Database Migration Service

Arquitecturas y Casos de Uso de Amazon RDS

Aurora

Características y Ventajas de Amazon Aurora en AWS

Endpoints y Funcionalidades Avanzadas en Amazon Aurora

Aurora Serverless: Configuración y Ventajas en AWS

Creación y Configuración de Bases de Datos Aurora en AWS RDS

Introducción a DynamoDB

Introducción a DynamoDB: Bases de Datos No Relacionales en AWS

Consistencia en DynamoDB: eventual vs fuerte

Creación y Configuración de Tablas en DynamoDB

Casos de Uso de DynamoDB en Aplicaciones Reales

Creación y Configuración de Tablas en DynamoDB para Encuestas

Particiones e Índices en DynamoDB

Particiones e Índices en DynamoDB para Optimización de Rendimiento

Operaciones Scan en DynamoDB: Funcionamiento y Eficiencia