No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Curso Pr谩ctico de SQL

Curso Pr谩ctico de SQL

Israel V谩zquez Morales

Israel V谩zquez Morales

Bases de datos distribuidas

24/29
Recursos

Aportes 19

Preguntas 1

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

Resumen:
Las bases de datos distribuidas: es una colecci贸n de m煤ltiples bases de datos separadas f铆sicamente que se comunican mediante una red inform谩tica.

VENTAJAS:

-desarrollo modular.
-incrementa la confiabilidad.
-mejora el rendimiento.
-mayor disponibilidad.
-rapidez de respuesta.

DESVENTAJAS:

-Manejo de seguridad.
-complejidad de procesamiento.
-Integridad de datos m谩s compleja.
-Costo.

TIPOS:

Homog茅neas: mismo tipo de BD, manejador y sistema operativo. (aunque est茅 distribuida).
Heterog茅nea: puede que var铆en alguna de los anteriores caracter铆sticas.
-OS
-Sistema de bases de datos.
-Modelo de datos.

ARQUITECTURAS:
-** cliente- servidor**: donde hay una BD principal y tiene varias BD que sirven como clientes o como esclavas que tratar谩n de obtener datos de la principal, a la que normalmente se hacen las escrituras.

  • Par a par (peer 2 peer): donde todos los puntos en la red de bd son iguales y se hablan como iguales sin tener que responder a una sola entidad.
  • multi manejador de bases de datos.

ESTRATEGIA DE DISE脩O:

  • top down: es cuando planeas muy bien la BD y la vas configurando de arriba hacia abajo de acuerdo a tus necesidades.
  • bottom up: ya existe esa BD y tratas de construir encima.

ALMACENAMIENTO DISTRIBUIDO:

-Fragmentaci贸n: qu茅 datos van en d贸nde.

fragmentaci贸n horizontal: (sharding) partir la tabla que est谩s utilizando en diferentes pedazos horizontales.

fragmentaci贸n vertical: cuando parto por columnas.

fragmentaci贸n mixta: cuando tienes algunas columnas y algunos datos en un lugar y algunas columnas y algunas tuplas en otro lugar.

-Replicaci贸n: tienes los mismos datos en todas ala BBDD no importa donde est茅n.

-replicaci贸n completa: cuando toda al BD est谩 en varias versiones a lo largo del globo, toda la informaci贸n est谩 igualita en todas las instancias de BD.
-replicaci贸n parcial: cuando algunos datos est谩n replicados y compartidos en varias zonas geogr谩ficas
-sin replicaci贸n: no est谩s replicando nada de los datos, cada uno est谩 completamente separa y no tienen que estarse hablando para sincronizar datos entre ellas.

DISTRIBUCI脫N DE DATOS:

-Distribuci贸n: c贸mo va a pasar la data entre una BD y otra. Tiene que ver mucho con networking, tiempos, latencia, etc. Pueden ser:

Centralizada: cuando la distribuyes des un punto central a todas las dem谩s
Particionada: est谩 partida en cada una de las diversas zonas geogr谩ficas y se comparten informaci贸n entre ellas.
Replicada: tener la misma informaci贸n en todas y entre ellas se hablan para siempre tener la misma versi贸n.

Blockchain es un tipo de Bases de Datos distribuida peer-to-peer

Bases de datos distribuidas
Son bases de datos ubicadas f铆sicamente separadas pero se encuentran conectadas a trav茅s de una red inform谩tica.

Ventajas

  • Desarrollo modular: se pueden destinar a diferentes usos o usuarios, por ejemplo usuarios por pa铆s
  • Incrementa la confiabilidad
  • Mejora el rendimiento, al ser un subset de datos
  • Mayor disponibilidad

Desventajas

  • Manejo de seguridad: la infraestructura se multiplica, es m谩s cara, lleva m谩s mantenimiento
  • Complejidad de procesamiento: cuando preciso m谩s datos de los que tengo en mi m贸dulo o subset
  • Integridad de datos m谩s compleja
  • Costos incrementados en general

Homog茅neas vs Heterog茅neas
De acuerdo a si utilizan o no los siguientes en la misma medida independientemente del m贸dulo

  • OS (Windows, Linux)
  • Sistema de base de datos (PostgreSQL, Oracle)
  • Modelos de datos

Arquitecturas

  • Cliente - Servidor
  • Peer 2 Peer
  • Multi manejador de base de datos

Estrategias de dise帽o

  • Top down: planeada estrat茅gicamente, instancias, jerarqu铆as, desde las necesidades
  • Bottom up: cuando ya existen servidores corriendo y no conviene empezar de cero

Almacenamiento distribuido

  • Fragmentaci贸n: cuando unos datos est谩n en un lado y otros en otro
  • Replicaci贸n: los datos est谩n replicados en m谩s de una locaci贸n
  • Distribuci贸n: es importante pensar en netwroks, latencia, etc.

Fragmentaci贸n

  • Horizontal: los datos de un pa铆s en un pa铆s, del otro pa铆s en otro lugar, etc.
  • Vertical: ciertos campos o columnas en una base de datos y otros campos en otra
  • Mixta

Replicaci贸n

  • Parcial: algunos datos est谩n replicados
  • Completa: todos los datos est谩n en todas las bases
  • Sin replicaci贸n

Distribuci贸n de datos

  • Centralizada
  • Particionada
  • Replicada

Esta clase tiene mucho que ver con Arquitectura de software.

Una Base de Datos Distribuida es una colecci贸n de datos que pertenecen l贸gicamente a un solo sistema, pero se encuentra f铆sicamente distribuido en varios computadores o servidores de datos en una red de computadoras. Un sistema de bases de datos distribuidas se compone de un conjunto de sitios l贸gicos, conectados entre s铆, mediante alg煤n tipo de red de comunicaciones, en el cual:

  • Cada sitio l贸gico puede tener un sistema de base de datos.

  • Los sitios han sido dise帽ados para trabajar en conjunto, con el fin de que un usuario de cualquier posici贸n geogr谩fica pueda obtener acceso a los datos desde cualquier punto de la red tal como si todos los datos estuvieran almacenados en la posici贸n propia del usuario. Entonces, la llamada 鈥淏ase de Datos Distribuida鈥 es en realidad una especie de 鈥渙bjeto virtual鈥, cuyos componentes se almacenan f铆sicamente en varias 鈥渂ases de datos reales鈥 ubicadas en diferentes sitios. En esencia es la uni贸n l贸gica de esas diferentes bases de datos.

En otras palabras, cada sitio tiene sus propias 鈥渂ases de datos reales" locales, sus propios usuarios locales, sus propios SGBD y programas para la administraci贸n de transacciones y su propio administrador de comunicaci贸n de datos. As铆 pues, el sistema de bases de datos distribuidas puede considerarse como una especie de sociedad entre los diferentes SGBD individuales locales.

Los microservicios que son una solucuon muy actual en algunos de sus casos comparten bases de datos o usan distribuidas

  • Los proyectos basados en Blockchain tienen una Arquitectura P2P, todo esta distribuido y no esta centralizada en una Entidad, todos los nodos se comunican entre ellos, y los archivos est谩n fragmentados en muchas partes y se distribuyen en una red usando la potencia computacional de los dispositivos de otras personas.
  • Y las distribuci贸n de Datos esta particionada y encriptada ya que las dem谩s personas no pueden ver como tal mi informaci贸n a menos que yo quiera compartirla porque solo tienen una peque帽a parte aleatoria de ellos.
XXIV. BASES DE DATOS DISTRIBUIDAS

鈥 Es una colecci贸n de m煤ltiples bases de datos separadas f铆sicamente que se comunican mediante una red inform谩tica.
鈥 Ventajas:
	鈼 Desarrollo modular: Al estar a la distancia se pueden destinar a distintos usos o usuarios
	鈼 Incrementa la confiabilidad
	鈼 Mejora el rendimiento
	鈼 Mayor disponibilidad
	鈼 Rapidez de respuesta
鈥 Desventajas:
	鈼 Manejo de seguridad
	鈼 Complejidad de procesamiento
	鈼 Integridad de datos m谩s compleja
	鈼 Costo
鈥 Homog茅neas y heterog茅neas
	鈼 OS
	鈼 Sistema de base
	鈼 Modelos de datos
鈥 Arquitecturas
	鈼 Cliente-servidor
	鈼 Peer 2 Peer
	鈼 Multi manejador de base de datos
鈥 Estrategias de dise帽o
	鈼 Top down
	鈼 Bottom up
鈥 Almacenamiento distribuido
	鈼 Fragmentaci贸n
		搂 Horizontal
		搂 Vertical
		搂 Mixta
	鈼 Replicaci贸n
		搂 Completa
		搂 Parcial
		搂 Sin replicaci贸n
	鈼 Distribuci贸n de los datos
		搂 Centralizada
		搂 Particionada
		搂 Replicada

Encontr茅 este significado: Las bases de datos distribuidas o Distributed Database Management System (DDBMS) se caracterizan por almacenar la informaci贸n en varias computadoras conectadas entre s铆, a las cu谩les el usuarios puede acceder desde cualquier sitio como si se tratara de una red local.

24. Bases de datos distribuidas

驴Qu茅 es?

Es una colecci贸n de m煤ltiples bases de datos separadas f铆sicamente

Ventajas

  • Desarrollo modular.
  • Incrementa la confiabilidad.
  • Mejora el rendimiento.
  • Mayor disponibilidad.
  • Rapidez de respuesta.

Desventajas

  • Manejo de seguridad.
  • Complejidad de procesamiento.
  • Integridad de datos m谩s compleja.
  • Costo.

Homog茅neas y hetereog茅neas

  • OS
  • Sistema de base de datos
  • Modelos de datos

Arquitecturas

  • Cliente - servidor.
  • Peer 2 Peer
  • Multi manejador de base de datos

Estrategias de dise帽o

  • Top down
  • Bottom up

Almacenamiento distribuido

  • Fragmentaci贸n
  • Replicaci贸n
  • Distribuci贸n

Fragmentaci贸n

  • Horizontal
  • Vertical
  • Mixta

Replicaci贸n

  • Completa
  • Parcial
  • Sin replicaci贸n

Distribuci贸n de los datos

  • Centrada
  • Particionada
  • Replicada

soy yo o esta mas serio de lo normal

Intentando simplificar el concepto de bases de datos distribuidas llegue a la conclusi贸n de que es lo mismo que nosotros hicimos en este curso pero conectado a una red y sincronizando esta data seg煤n sea necesario (o no)
Por ejemplo, Pepe, en Colombia, hizo un informe que intenta justificar los altos precios en las colegiaturas de algunos alumnos. Hoy, aca en Argentina, Jose nos cuenta que la colegiatura de sus alumnos disminuyeron su precio gracias a un subsidio del estado. Entonces yo le aviso a Pepe que actualizamos la data y el puede hacer su informe de vuelta sin ningun problema.

Caracter铆sticas a tener en cuenta
Entre las caracter铆sticas de una base de datos distribuida se pueden citar las siguientes:

Est谩 formada por varias computadoras, a las cuales se les denomina nodos.
Los nodos se comunican entre s铆 mediante una red de comunicaciones.
Cada uno de los ordenadores que forman parte de la red tiene autonom铆a local.
Generalmente, la red de computadoras no depende de ning煤n sitio central.
Tiene un funcionamiento independiente de su localizaci贸n.
Se realizan continuas transacciones de informaci贸n entre nodos.
La base de datos funciona independientemente del equipo, sistema operativo o re

**ACERCA DE LAS BASE DE DATOS HOMOGENEAS Y HETEROGENEAS o cualquier otro tipo de BD como MongoDB... L**as bases de datos homog茅neas y heterog茅neas se pueden empaquetar en Docker y trabajarlas como una sola. Para ello, se pueden utilizar dos enfoques: **Enfoque 1:** Empaquetar cada base de datos en un contenedor Docker independiente. * **Enfoque 2:** Empaquetar todas las bases de datos en un 煤nico contenedor Docker.

Genial鈥!

Muy bueno el cardio , pero desde aqu铆 vuelve el X1.75 xddd

Base de datos distribuidas


Es una colecci贸n de base de datos, una misma de datos que esta partida en diversas tipos de datos que no se encuentran f铆sicamente en el mismo sitio, pero se encuentra conectados por una red informatica(internet).

Ventajas

  • Desarrollo modular 鈫 Podemos dividir la informaci贸n, para simplificar los tipos de respuestas
  • Incrementa la confiabilidad.
  • Mejora el rendimiento
  • Mayor disponibilidad
  • Rapidez de respuesta.

Desventajas

  • Manejo de seguirad 鈫 Tenemos que fortificar la seguridad por cada ubicaci贸n.
  • Complejidad del procesamiento 鈫 Si solo quiero consultar datos de una ubicaci贸n todo bien, pero si quiero traer datos de otra ubicaci贸n, se puede volver compleja la operaci贸n.
  • Incrementa el costo 鈫 Mantenimiento y tener sitios dedicados por todo el mundo

Tipos

Homogeneas Tienen el mismo sistema operativo, sistema de base de datos

Hererogeneas Diversos sistemas operativos o bases de datos

Arquitectura

Cliente - servidor Una base de datos principal y otra que trabajan como servidores

Par a par 鈫 Todas las bases de datos se habla por iguales

Multi manejador de base de datos 鈫 Varios manejadores de base de datos conectados

Estrategia de dise帽o

Top down 鈫 Plandeada desde arriba hacia abajo

Bottom up 鈫 Algo que ya existe as铆 que tenemos que construir sobre ella las estrucutas

Almacenamiento distribuido

  • Fragmentaci贸n 鈫 que datos van en donde

    • Horizontal 鈫 Partir la tabla en diversos partes horizontales
    • Verticalmente 鈫 Partir por columnas
    • Mixtas 鈫 Clumnas y tuplas
  • Replicaci贸n 鈫 Como va pasar la dos entre cada parte

    • Completa 鈫 todo en cada ubicaci贸n
    • Sin replicaci贸n 鈫 Cada quien est谩 separada
  • Distribuci贸n

    • Centralizada
    • Particionada
    • Replicada

Bases de datos distribuidas

Las bases de datos distribuidas son aquellas que est谩n divididas en m煤ltiples servidores y que se pueden utilizar de manera conjunta para almacenar y gestionar grandes cantidades de datos. Una base de datos distribuida se dise帽a para mejorar el rendimiento, la escalabilidad y la disponibilidad de la base de datos al distribuir la carga de trabajo entre varios servidores.

Una base de datos distribuida se puede configurar de varias maneras, pero una de las m谩s comunes es la replicaci贸n de bases de datos. En esta configuraci贸n, se crea una copia de la base de datos en cada servidor y se sincronizan entre s铆 para mantener una copia id茅ntica de los datos en cada servidor. Esto permite que la base de datos siga funcionando incluso si un servidor falla, ya que hay otras copias de los datos disponibles.

Otra forma de configurar una base de datos distribuida es mediante el uso de un esquema de particionamiento de datos. En este esquema, se divide la base de datos en fragmentos o particiones y cada partici贸n se almacena en un servidor diferente. Esto permite que la base de datos maneje grandes cantidades de datos de manera m谩s eficiente, ya que cada servidor solo tiene que procesar una parte de los datos en lugar de toda la base de datos.

Ventajas
鈼 Desarrollo modular.
鈼 Incrementa la confiabilidad.
鈼 Mejora el rendimiento.
鈼 Mayor disponibilidad.
鈼 Rapidez de respuesta.

Desventajas
鈼 Manejo de seguridad.
鈼 Complejidad de procesamiento.
鈼 Integridad de datos m谩s compleja.
鈼 Costo.

Tenemos diferentes tipos Homog茅neas que son la base de datos(BD) que tenemos con el mismo tipo de BD manejador y sistema operativo, por ejemplo si tengo la BD de M茅xico y otra en Colombia pero tienen la misma versi贸n el sistema operativo, trabajan las dos en PostgreSQL y el modelado de datos es igual, se considera homog茅nea. Y heterog茅neas son las que tienen diferentes sistema operativo, o diferente tipo de BD y aun as铆 tiene cierta conexi贸n.

鈼 OS
鈼 Sistema de base de datos
鈼 Modelos de datos

Arquitecturas
鈼 Cliente - servidor.

鈼 Par a par (Peer 2 Peer). Donde todos los puntos en la red de BD distribuidas son iguales, y se hablan igual, se organizan entre ellas y se hablan de to a to, sin tener que responder a una sola entidad que sea coordinadora de las dem谩s.

鈼 Multi manejador de base de datos. Son el tipo de datos heterog茅neas.

Estrategias de dise帽o
Cuando se est谩 pensando en una BD distribuida se puede hacer:

鈼 Top down. Quiere decir que cuando se planea muy bien y empiezo a solicitar hasta arriba un coordinador, que sea un servidor de 鈥渢al tipo鈥, y para abajo quiero tener tres instancias de PostgreSQL y quiero otra instancia de MongoBD y que se conecte a trav茅s de 鈥渢al cosa鈥. Entonces se va configurando de arriba hacia abajo, de acuerdo a las necesidades.

鈼 Bottom up. A veces de debe de hacer un BD ya distribuida, y no es conveniente empezar de cero, y cambiar datos o hacer migraciones; si no m谩s bien, unir esas dos BD y eso se le considera Bottom up.

Almacenamiento distribuido
Esto tiene que ver, que por estar guardando las BD de manera distribuida, f铆sicamente tiene algunas implicaciones; algunas de ellas son:

鈼 Fragmentaci贸n de datos, que datos van en qu茅 lugar.
鈼 Replicaci贸n, donde se tiene todos los datos en la misma BD para todos.
鈼 Distribuci贸n, como va a pasar la data entre una BD y otra BD, tiempos latencias etc.

Fragmentaci贸n
Se puede considerar:

鈼 Horizontal. Es lo que normalmente consideramos como 鈥淪harding鈥, y tiene que ver con partir la tabla que se est谩 utilizando en diferentes partes horizontales.

鈼 Vertical. Es cuando manejas algo columnar. Quiere decir que quiero manejar alg煤n row a un lado de la BD, pero todo lo dem谩s me sirve tener en una parte distinta, cuando partes por columnas, a esto se le considera una fragmentaci贸n vertical.

鈼 Mixta. Cuando se tiene algunas columnas y algunos datos en alg煤n lugar, y algunas columnas o tuplas en otro lugar.

Replicaci贸n
鈼 Completa. Es cuando toda la BD est谩 en varias versiones a lo largo del globo, toda la informaci贸n est谩 igual.

鈼 Parcial. Es cuando algunos datos est谩n compartidos y replicados en varias zonas geogr谩ficas.

鈼 Sin replicaci贸n. Simplemente no estoy replicando los datos.

Distribuci贸n de los datos

鈼 Centralizada
鈼 Particionada
鈼 Replicada

Las bases de datos distribuidas o Distributed Database Management System (DDBMS) se caracterizan por almacenar la informaci贸n en varias computadoras conectadas entre s铆, a las cu谩les el usuarios puede acceder desde cualquier sitio como si se tratara de una red local.