
Miguel Angel Velazquez Romero
PreguntaMuy cool y todo las NoSQL DB, pero como se normalizan? Ósea, como le hacemos para evitar duplicidad, redundancia, campos nulos, etc. Hay algún tipo de estándar como en las base de datos relacionales?

Miguel Angel Velazquez Romero
La normalización no trata de mejorar el rendimiento de una motor o base de datos, trata de mejorar la calidad del almacenamiento de los datos.
Por ejemplo, a mi me interesan estos temas porque en ML y DC, la calidad de los datos es fundamental no hay DC y ML sin datos de calidad, y si bien se pueden "limpiar", no es lo mismo que tratar con datos limpios, entre mas se limpien hay más sesgo, entre mas sesgo, hay mas error el la predicción o clasificación.
Por eso es que dudo que esa supuesta "flexibilidad" que dan las bases de datos NoSQL sea útil de verdad, al final de cuentas si no hay una buena moralización de la DB y si no hay calidad en la infraestructura, esos datos no servirán y las empresas grandes y las que si contraten arquitectos de datos de verdad (no administradores), que por lo regular están certificados en Oracle, tendrás mejores datos y mucho más posibilidades de triunfar a largo plazo.

Luis Lira
Con la base de datos NoSQL que yo sepa no se normalizan, pero en el caso de Mongo existen otro tipo de buenas prácticas para su performance, aquí puedes leer sobre eso https://www.mongodb.com/blog/post/performance-best-practices-mongodb-data-modeling-and-memory-sizing

Miguel Angel Velazquez Romero
Muchas gracias por tu repuesta :)

Jonathan Ramirez
Hola, buena noche
Con base en lo poco que he estado trabajando con ellas y estudiado acerca del tema, las bases de datos NoSQL se usan para solventar problemas ligeramente diferentes a los de las bases SQL "tradicionales"; no existe una normalización "formal", lo que he visto que en algunos sitios recomiendan es comenzar a normalizar hasta 3R para tener en claro lo que se tiene que hacer, a partir de ahí se "desnormaliza" con base en las necesidades del negocio, en lugar de hacer consultas complejas entre varias tablas, se busca hacer documentos que engloben los datos más utilizados para tenerlos siempre a la mano. Si tuvieras un inventario de productos podrías tener en distintos documentos ("tablas") la información de todos ellos, pero quizás si tienes que cargar una página con el resumen de todos ellos, sería más conveniente ya tener los documentos preparados con la información que siempre se utiliza y no tener que realizar siempre muchos JOINs Las ventajas de NoSQL es que no se tiene que tener un esquema rígido para trabajar (excelente para proyectos nuevos y en los cuales no se conoce al 100% las características que han de tener), pero tiene algunas complicaciones como el hecho de que hay que idear mecanismos propios para evitar la duplicidad, saber donde utilizar un objeto embebido o una referencia a un objeto (concepto parecido a una llave primaria)