Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Curso Práctico de SQL

Curso Práctico de SQL

Israel Vázquez Morales

Israel Vázquez Morales

Bases de datos distribuidas

24/29
Recursos

Aportes 8

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Resumen:
Las bases de datos distribuidas: es una colección de múltiples bases de datos separadas físicamente que se comunican mediante una red informática.

VENTAJAS:

-desarrollo modular.
-incrementa la confiabilidad.
-mejora el rendimiento.
-mayor disponibilidad.
-rapidez de respuesta.

DESVENTAJAS:

-Manejo de seguridad.
-complejidad de procesamiento.
-Integridad de datos más compleja.
-Costo.

TIPOS:

Homogéneas: mismo tipo de BD, manejador y sistema operativo. (aunque esté distribuida).
Heterogénea: puede que varíen alguna de los anteriores características.
-OS
-Sistema de bases de datos.
-Modelo de datos.

ARQUITECTURAS:
-** cliente- servidor**: donde hay una BD principal y tiene varias BD que sirven como clientes o como esclavas que tratarán de obtener datos de la principal, a la que normalmente se hacen las escrituras.

  • Par a par (peer 2 peer): donde todos los puntos en la red de bd son iguales y se hablan como iguales sin tener que responder a una sola entidad.
  • multi manejador de bases de datos.

ESTRATEGIA DE DISEÑO:

  • top down: es cuando planeas muy bien la BD y la vas configurando de arriba hacia abajo de acuerdo a tus necesidades.
  • bottom up: ya existe esa BD y tratas de construir encima.

ALMACENAMIENTO DISTRIBUIDO:

-Fragmentación: qué datos van en dónde.

fragmentación horizontal: (sharding) partir la tabla que estás utilizando en diferentes pedazos horizontales.

fragmentación vertical: cuando parto por columnas.

fragmentación mixta: cuando tienes algunas columnas y algunos datos en un lugar y algunas columnas y algunas tuplas en otro lugar.

-Replicación: tienes los mismos datos en todas ala BBDD no importa donde estén.

-replicación completa: cuando toda al BD está en varias versiones a lo largo del globo, toda la información está igualita en todas las instancias de BD.
-replicación parcial: cuando algunos datos están replicados y compartidos en varias zonas geográficas
-sin replicación: no estás replicando nada de los datos, cada uno está completamente separa y no tienen que estarse hablando para sincronizar datos entre ellas.

DISTRIBUCIÓN DE DATOS:

-Distribución: cómo va a pasar la data entre una BD y otra. Tiene que ver mucho con networking, tiempos, latencia, etc. Pueden ser:

Centralizada: cuando la distribuyes des un punto central a todas las demás
Particionada: está partida en cada una de las diversas zonas geográficas y se comparten información entre ellas.
Replicada: tener la misma información en todas y entre ellas se hablan para siempre tener la misma versión.

Blockchain es un tipo de Bases de Datos distribuida peer-to-peer

Bases de datos distribuidas
Son bases de datos ubicadas físicamente separadas pero se encuentran conectadas a través de una red informática.

Ventajas

  • Desarrollo modular: se pueden destinar a diferentes usos o usuarios, por ejemplo usuarios por país
  • Incrementa la confiabilidad
  • Mejora el rendimiento, al ser un subset de datos
  • Mayor disponibilidad

Desventajas

  • Manejo de seguridad: la infraestructura se multiplica, es más cara, lleva más mantenimiento
  • Complejidad de procesamiento: cuando preciso más datos de los que tengo en mi módulo o subset
  • Integridad de datos más compleja
  • Costos incrementados en general

Homogéneas vs Heterogéneas
De acuerdo a si utilizan o no los siguientes en la misma medida independientemente del módulo

  • OS (Windows, Linux)
  • Sistema de base de datos (PostgreSQL, Oracle)
  • Modelos de datos

Arquitecturas

  • Cliente - Servidor
  • Peer 2 Peer
  • Multi manejador de base de datos

Estrategias de diseño

  • Top down: planeada estratégicamente, instancias, jerarquías, desde las necesidades
  • Bottom up: cuando ya existen servidores corriendo y no conviene empezar de cero

Almacenamiento distribuido

  • Fragmentación: cuando unos datos están en un lado y otros en otro
  • Replicación: los datos están replicados en más de una locación
  • Distribución: es importante pensar en netwroks, latencia, etc.

Fragmentación

  • Horizontal: los datos de un país en un país, del otro país en otro lugar, etc.
  • Vertical: ciertos campos o columnas en una base de datos y otros campos en otra
  • Mixta

Replicación

  • Parcial: algunos datos están replicados
  • Completa: todos los datos están en todas las bases
  • Sin replicación

Distribución de datos

  • Centralizada
  • Particionada
  • Replicada

Una Base de Datos Distribuida es una colección de datos que pertenecen lógicamente a un solo sistema, pero se encuentra físicamente distribuido en varios computadores o servidores de datos en una red de computadoras. Un sistema de bases de datos distribuidas se compone de un conjunto de sitios lógicos, conectados entre sí, mediante algún tipo de red de comunicaciones, en el cual:

  • Cada sitio lógico puede tener un sistema de base de datos.

  • Los sitios han sido diseñados para trabajar en conjunto, con el fin de que un usuario de cualquier posición geográfica pueda obtener acceso a los datos desde cualquier punto de la red tal como si todos los datos estuvieran almacenados en la posición propia del usuario. Entonces, la llamada “Base de Datos Distribuida” es en realidad una especie de “objeto virtual”, cuyos componentes se almacenan físicamente en varias “bases de datos reales” ubicadas en diferentes sitios. En esencia es la unión lógica de esas diferentes bases de datos.

En otras palabras, cada sitio tiene sus propias “bases de datos reales" locales, sus propios usuarios locales, sus propios SGBD y programas para la administración de transacciones y su propio administrador de comunicación de datos. Así pues, el sistema de bases de datos distribuidas puede considerarse como una especie de sociedad entre los diferentes SGBD individuales locales.

Esta clase tiene mucho que ver con Arquitectura de software.

Características a tener en cuenta
Entre las características de una base de datos distribuida se pueden citar las siguientes:

Está formada por varias computadoras, a las cuales se les denomina nodos.
Los nodos se comunican entre sí mediante una red de comunicaciones.
Cada uno de los ordenadores que forman parte de la red tiene autonomía local.
Generalmente, la red de computadoras no depende de ningún sitio central.
Tiene un funcionamiento independiente de su localización.
Se realizan continuas transacciones de información entre nodos.
La base de datos funciona independientemente del equipo, sistema operativo o re

XXIV. BASES DE DATOS DISTRIBUIDAS

• Es una colección de múltiples bases de datos separadas físicamente que se comunican mediante una red informática.
• Ventajas:
	○ Desarrollo modular: Al estar a la distancia se pueden destinar a distintos usos o usuarios
	○ Incrementa la confiabilidad
	○ Mejora el rendimiento
	○ Mayor disponibilidad
	○ Rapidez de respuesta
• Desventajas:
	○ Manejo de seguridad
	○ Complejidad de procesamiento
	○ Integridad de datos más compleja
	○ Costo
• Homogéneas y heterogéneas
	○ OS
	○ Sistema de base
	○ Modelos de datos
• Arquitecturas
	○ Cliente-servidor
	○ Peer 2 Peer
	○ Multi manejador de base de datos
• Estrategias de diseño
	○ Top down
	○ Bottom up
• Almacenamiento distribuido
	○ Fragmentación
		§ Horizontal
		§ Vertical
		§ Mixta
	○ Replicación
		§ Completa
		§ Parcial
		§ Sin replicación
	○ Distribución de los datos
		§ Centralizada
		§ Particionada
		§ Replicada

Intentando simplificar el concepto de bases de datos distribuidas llegue a la conclusión de que es lo mismo que nosotros hicimos en este curso pero conectado a una red y sincronizando esta data según sea necesario (o no)
Por ejemplo, Pepe, en Colombia, hizo un informe que intenta justificar los altos precios en las colegiaturas de algunos alumnos. Hoy, aca en Argentina, Jose nos cuenta que la colegiatura de sus alumnos disminuyeron su precio gracias a un subsidio del estado. Entonces yo le aviso a Pepe que actualizamos la data y el puede hacer su informe de vuelta sin ningun problema.