Muy cool y todo las NoSQL DB, pero como se normalizan? Ósea, como le hacemos para evitar duplicidad, redundancia, campos nulos, etc. Hay ...

Pregunta de la clase:
Bases de datos NoSQL
Miguel Angel Velazquez Romero

Miguel Angel Velazquez Romero

Pregunta
studenthace 4 años

Muy cool y todo las NoSQL DB, pero como se normalizan? Ósea, como le hacemos para evitar duplicidad, redundancia, campos nulos, etc. Hay algún tipo de estándar como en las base de datos relacionales?

4 respuestas
para escribir tu comentario
    Miguel Angel Velazquez Romero

    Miguel Angel Velazquez Romero

    studenthace 4 años

    La normalización no trata de mejorar el rendimiento de una motor o base de datos, trata de mejorar la calidad del almacenamiento de los datos.

    Por ejemplo, a mi me interesan estos temas porque en ML y DC, la calidad de los datos es fundamental no hay DC y ML sin datos de calidad, y si bien se pueden "limpiar", no es lo mismo que tratar con datos limpios, entre mas se limpien hay más sesgo, entre mas sesgo, hay mas error el la predicción o clasificación.

    Por eso es que dudo que esa supuesta "flexibilidad" que dan las bases de datos NoSQL sea útil de verdad, al final de cuentas si no hay una buena moralización de la DB y si no hay calidad en la infraestructura, esos datos no servirán y las empresas grandes y las que si contraten arquitectos de datos de verdad (no administradores), que por lo regular están certificados en Oracle, tendrás mejores datos y mucho más posibilidades de triunfar a largo plazo.

    Miguel Angel Velazquez Romero

    Miguel Angel Velazquez Romero

    studenthace 4 años

    Muchas gracias por tu repuesta :)

    Jonathan Ramirez

    Jonathan Ramirez

    studenthace 4 años

    Hola, buena noche

    Con base en lo poco que he estado trabajando con ellas y estudiado acerca del tema, las bases de datos NoSQL se usan para solventar problemas ligeramente diferentes a los de las bases SQL "tradicionales"; no existe una normalización "formal", lo que he visto que en algunos sitios recomiendan es comenzar a normalizar hasta 3R para tener en claro lo que se tiene que hacer, a partir de ahí se "desnormaliza" con base en las necesidades del negocio, en lugar de hacer consultas complejas entre varias tablas, se busca hacer documentos que engloben los datos más utilizados para tenerlos siempre a la mano. Si tuvieras un inventario de productos podrías tener en distintos documentos ("tablas") la información de todos ellos, pero quizás si tienes que cargar una página con el resumen de todos ellos, sería más conveniente ya tener los documentos preparados con la información que siempre se utiliza y no tener que realizar siempre muchos JOINs Las ventajas de NoSQL es que no se tiene que tener un esquema rígido para trabajar (excelente para proyectos nuevos y en los cuales no se conoce al 100% las características que han de tener), pero tiene algunas complicaciones como el hecho de que hay que idear mecanismos propios para evitar la duplicidad, saber donde utilizar un objeto embebido o una referencia a un objeto (concepto parecido a una llave primaria)

Curso Básico de MongoDB

Curso Básico de MongoDB

Domina las bases de MongoDB, el motor de NoSQL que provee alta capacidad de almacenamiento. Optimiza tus procesos gracias a la velocidad de consulta y aprovecha la escalabilidad de este tipo de bases de datos en tus proyectos.

Curso Básico de MongoDB
Curso Básico de MongoDB

Curso Básico de MongoDB

Domina las bases de MongoDB, el motor de NoSQL que provee alta capacidad de almacenamiento. Optimiza tus procesos gracias a la velocidad de consulta y aprovecha la escalabilidad de este tipo de bases de datos en tus proyectos.