Uso de MongoDB Aggregation Framework y Query Language

Clase 2 de 21 • Curso de MongoDB: Aggregation Framework

Contenido del curso

Introducción

Operaciones básicas

Etapas de Aggregation Framework

Operaciones avanzadas

Performance y optimización

Próximos pasos

21
Uso de MongoDB Aggregation Framework para Consultas Complejas
02:20 min

Tomar examen

Resumen

Elegir la herramienta correcta para cada consulta en MongoDB puede marcar una gran diferencia en rendimiento, costos y legibilidad del código. Comprender las diferencias entre el Standard Query Language, el Aggregation Framework y MapReduce es fundamental para trabajar de forma eficiente con bases de datos documentales.

¿Cuándo conviene usar el Standard Query Language de MongoDB?

La regla principal es simple: si la consulta se puede resolver con el sistema estándar de consultas, úsalo directamente [0:18]. El comando find resulta ideal para filtrados sencillos donde no se necesitan transformaciones complejas ni agrupaciones múltiples. Ir por esta vía implica menor consumo de recursos, memoria y mejor optimización.

Por ejemplo, para obtener documentos de Airbnb dentro de un rango de fechas y calcular un contador, el Standard Query Language lo resuelve con una sola instrucción find que recibe la fecha inicial, la fecha final y devuelve el conteo [1:18].

¿En qué se diferencia el Aggregation Framework del sistema de consultas estándar?

El MongoDB Aggregation Framework entra en escena cuando la complejidad de la consulta aumenta: múltiples agrupaciones, transformaciones de resultados o cálculos avanzados [0:30]. A diferencia de find, este framework está basado en etapas (stages), lo que significa que los datos pasan por un pipeline secuencial.

Para el mismo ejemplo del rango de fechas, el Aggregation Framework requiere definir varias etapas [1:40]:

$match: filtra los documentos por el rango de fechas.
$group: agrupa y cuenta los documentos resultantes.
$project: da formato al resultado final.

Ambos enfoques producen exactamente el mismo resultado, pero el pipeline de agregación consume más recursos. Por eso, no es recomendable usar Aggregation Framework para todo solo porque sea más poderoso [0:50]. Los costos de memoria y procesamiento importan.

¿Qué es MapReduce y por qué quedó obsoleto?

Antes de la llegada del Aggregation Framework existía MapReduce, un mecanismo para filtrar, categorizar, transformar y agregar datos de manera similar [2:20]. Sin embargo, a partir de la versión 5.0 de MongoDB, MapReduce quedó oficialmente obsoleto a favor del Aggregation Framework [2:38].

MapReduce presenta varias desventajas importantes:

Se basa en funciones JavaScript con alto consumo de recursos [2:55].
El código es más extenso y complejo.
Servicios en la nube como Mongo Atlas lo tienen restringido; en la versión gratuita no se permite su uso [3:03].

¿Cómo se compara un pipeline de agregación con MapReduce en la práctica?

Un caso concreto lo ilustra con claridad: un requerimiento del departamento de marketing que pide agrupar usuarios por edad y ordenar según el canal de compra, calculando la media de edad por método de compra [3:18].

Con el Aggregation Framework, se define un pipeline limpio con etapas encadenadas. La versión equivalente en MapReduce requiere definir tres funciones JavaScript independientes: map, reduce y finalize, respetando una estructura rígida donde se especifica manualmente el formato del resultado final [3:38].

Al ejecutar ambos scripts, el resultado es idéntico, pero MapReduce demanda mayor cantidad de recursos y memoria [3:58].

¿Cuál es la recomendación final para elegir entre estas alternativas?

La decisión se resume en tres criterios prácticos:

Consulta simple: usa el Standard Query Language con find.
Consulta compleja con agrupaciones o transformaciones: usa Aggregation Framework.
MapReduce: evítalo si tu versión de MongoDB lo permite; está obsoleto desde la versión 5.0.

Probar ambos enfoques por cuenta propia es la mejor forma de confirmar cuál se adapta a cada escenario. La clave está en seleccionar la herramienta adecuada para cada tipo de trabajo, equilibrando potencia y eficiencia en el uso de recursos.

Comentarios

Waldir Zapata Garcia

student•

Map reduce esta deprecated segun la documentación de mongoDB. para más información revisar: https://docs.mongodb.com/manual/core/map-reduce.

Ejemplo del framework aggregation utilizando visual studio code en un archivo javascript (en mi caso se llama ejemploAggregation.js)

var database=db.getSiblingDB("sample_airbnb")
var coleccion=database.sales

var resultado = coleccion.find().count()
print(resultado)

var resultado = coleccion.aggregate([
    {$match: {"storeLocation":"London"}},

    {$group: {
        _id: "$purchaseMethod",
        avgAge: {$avg: "$customer.age"}
        }
    },

    {$project:{
        _id: 0,
        metodo: "$_id",
        mediaEdad: {$round:["$avgAge"]}
        }
    },

    {$sort:{ "mediaEdad": 1 }}

])

print(resultado)

Ejeución a traves de la terminal de comandos:

PS D:\Usuarios\Aggregations> mongosh --quiet .\ejemploAggregation.js

#Resultado:
[
  { metodo: 'Online', mediaEdad: 43 },
  { metodo: 'Phone', mediaEdad: 44 },
  { metodo: 'In store', mediaEdad: 45 }
]

Carlos Olivera Terrazas

teacher•

Hola Waldir, es correcto, map-reduce está discontinuado, pero se lo sigue usando en implementaciones antiguas que todavía no migraron a Aggregation Framework.

La implementación en JavaScript y Node.js es muy sencilla como se puede ver en el código que nos compartiste, gracias!

Adonis Daniel Mendoza Rebolledo

student•

Si la versión de Mongo te lo permite. Para consultas complejas usar aggregation

Waldir Zapata Garcia

student•

Ejemplo de la collecion "listingsAndReviews": utilizando el metodo find:

sample_airbnb> db.listingsAndReviews.find({last_review: {$gte: new Date('2019-01-01'), $lte: new Date('2020-01-01')}}).count()

Resultado: 2263

Utilizando el framework aggregate:

sample_airbnb> db.getCollection("listingsAndReviews").aggregate([
 {$match: {last_review: {$gte: new Date('2019-01-01'), $lte: new Date('2020-01-01')}}},
 {$group: {_id: null, Total:{$sum: 1}}},
 {$project: {_id:0}}
]);

Resultado:
[ { Total: 2263 } ]

En conclusión: para este caso es optimo utilizar las consultas comunes con el metodo find()

John Alexander Peña Bedoya

student•

Si tengo la fecha en milisegundos y necesito hacer la comparación con la fecha actual, se podria trabajar con aggregate ?

Carlos Olivera Terrazas

teacher•

Hola John,

Puedes trabajar con fechas usando los mismos operadores de comparación, que usarías con las consultas estándar de MongoDB, como ser: $gt, $lt y otros.

Por ejemplo:

db.tuColeccion.aggregate([
    {
        $match: {
            tuCampoFecha: {
                $gte: new Date(new Date().getTime() - (1000 * 60 * 60 * 24)) // Últimas 24 horas
            }
        }
    },
    // Puedes agregar más etapas de agregación según sea necesario
])

Waldir Zapata Garcia

student•

Donde puedo descargar los scripts para creacion de BD mongodb, colecciones e insertar registros.?

Waldir Zapata Garcia

student•

en los ejemplos veo scripts, querys, pero no estan en la sección de recursos.

Carlos Olivera Terrazas

teacher•

Hola Waldir, para el desarrollo del curso, si usas directamente MongoDB Atlas los registros son parte de la base de datos de ejemplo, eso viene con el servicio de Atlas.

Por otro lado, para poder configurar y usar un entorno local, tienes los recursos y la guía en GitHub:

https://github.com/carlos-olivera/mongo_db_w_sample_db

Emanuel Salazar

student•

Tema: Uso del Aggregation Framework en MongoDB.
Cuándo usarlo:
- Para consultas simples, utiliza el estándar Query Language (find).
- Para consultas complejas que involucren múltiples agrupaciones y transformaciones, elige el Aggregation Framework.
Diferencias clave:
- Query Language: Más eficiente en consultas sencillas.
- Aggregation Framework: Ideal para cálculos complejos y permite un mejor manejo de recursos.
Alternativa: Antes existía MapReduce, pero se recomienda el Aggregation Framework por su eficiencia y menor consumo de recursos.
Próxima clase: Configuración del entorno de trabajo para usar Mongo Atlas, Visual Code y Docker.

Ronaldo Jiménez

student•

Repo del curso:

Waldir Zapata Garcia

student•

Si quieres trabajar localmente estas consultas podrás importar las colecciones con el comando:

PS D:\Usuarios\data> mongoimport --db sample_airbnb --collection accounts --file accounts.json --jsonArray

2023-09-19T01:02:22.831-0500    connected to: mongodb://localhost/
2023-09-19T01:02:23.084-0500    1746 document(s) imported successfully. 0 document(s) failed to import.

PS D:\Usuarios\data> mongoimport --db sample_airbnb --collection transactions --file transactions.json --jsonArray

2023-09-19T01:02:54.401-0500    connected to: mongodb://localhost/
2023-09-19T01:02:55.178-0500    1746 document(s) imported successfully. 0 document(s) failed to import.

PS D:\Usuarios\data> mongoimport --db sample_airbnb --collection sales --file sales.json --jsonArray

2023-09-19T01:03:15.653-0500    connected to: mongodb://localhost/
2023-09-19T01:03:16.072-0500    5000 document(s) imported successfully. 0 document(s) failed to import.

PS D:\Usuarios\data> mongoimport --db sample_airbnb --collection customers --file customers.json --jsonArray

2023-09-19T01:04:01.367-0500    connected to: mongodb://localhost/
2023-09-19T01:04:01.589-0500    500 document(s) imported successfully. 0 document(s) failed to import.

![Captura.PNG](https://static.platzi.com/media/user_upload/Captura-ef731751-d902-43e6-b252-b99de345e444.jpg)PS D:\Usuarios\data> mongoimport --db sample_airbnb --collection listingsAndReviews --file listingsAndReview.json --jsonArray
2023-09-19T01:04:49.042-0500    connected to: mongodb://localhost/
2023-09-19T01:04:50.186-0500    5555 document(s) imported successfully. 0 document(s) failed to import.

Waldir Zapata Garcia

student•

Query language:

Para el uso de consultas simples

Aggregation Framework*:

Para el uso de querys donde hay que agrupar campos, realizar calculos, transformar en un solo tiempo de ejecución.

var database=db.getSiblingDB("sample_airbnb")
var coleccion=database.sales

var resultado = coleccion.find().count()
print(resultado)

var resultado = coleccion.aggregate([
    {$match: {"storeLocation":"London"}},

    {$group: {
        _id: "$purchaseMethod",
        avgAge: {$avg: "$customer.age"}
        }
    },

    {$project:{
        _id: 0,
        metodo: "$_id",
        mediaEdad: {$round:["$avgAge"]}
        }
    },

    {$sort:{ "mediaEdad": 1 }}

])

print(resultado)

PS D:\Usuarios\Aggregations> mongosh --quiet .\ejemploAggregation.js

#Resultado:
[
  { metodo: 'Online', mediaEdad: 43 },
  { metodo: 'Phone', mediaEdad: 44 },
  { metodo: 'In store', mediaEdad: 45 }
]

sample_airbnb> db.getCollection("listingsAndReviews").aggregate([
 {$match: {last_review: {$gte: new Date('2019-01-01'), $lte: new Date('2020-01-01')}}},
 {$group: {_id: null, Total:{$sum: 1}}},
 {$project: {_id:0}}
]);

Resultado:
[ { Total: 2263 } ]

db.tuColeccion.aggregate([
    {
        $match: {
            tuCampoFecha: {
                $gte: new Date(new Date().getTime() - (1000 * 60 * 60 * 24)) // Últimas 24 horas
            }
        }
    },
    // Puedes agregar más etapas de agregación según sea necesario
])

PS D:\Usuarios\data> mongoimport --db sample_airbnb --collection accounts --file accounts.json --jsonArray

2023-09-19T01:02:22.831-0500    connected to: mongodb://localhost/
2023-09-19T01:02:23.084-0500    1746 document(s) imported successfully. 0 document(s) failed to import.

PS D:\Usuarios\data> mongoimport --db sample_airbnb --collection transactions --file transactions.json --jsonArray

2023-09-19T01:02:54.401-0500    connected to: mongodb://localhost/
2023-09-19T01:02:55.178-0500    1746 document(s) imported successfully. 0 document(s) failed to import.

PS D:\Usuarios\data> mongoimport --db sample_airbnb --collection sales --file sales.json --jsonArray

2023-09-19T01:03:15.653-0500    connected to: mongodb://localhost/
2023-09-19T01:03:16.072-0500    5000 document(s) imported successfully. 0 document(s) failed to import.

PS D:\Usuarios\data> mongoimport --db sample_airbnb --collection customers --file customers.json --jsonArray

2023-09-19T01:04:01.367-0500    connected to: mongodb://localhost/
2023-09-19T01:04:01.589-0500    500 document(s) imported successfully. 0 document(s) failed to import.

![Captura.PNG](https://static.platzi.com/media/user_upload/Captura-ef731751-d902-43e6-b252-b99de345e444.jpg)PS D:\Usuarios\data> mongoimport --db sample_airbnb --collection listingsAndReviews --file listingsAndReview.json --jsonArray
2023-09-19T01:04:49.042-0500    connected to: mongodb://localhost/
2023-09-19T01:04:50.186-0500    5555 document(s) imported successfully. 0 document(s) failed to import.

Uso de MongoDB Aggregation Framework y Query Language

Introducción

MongoDB Aggregation Framework: Filtrado y Análisis de Datos