242

Qué es el teorema CAP y cómo elegir la base de datos para tu proyecto

10637Puntos

hace 6 años

Cuando hablamos de almacenar y gestionar información hay varios conceptos que se van haciendo cada vez mas relevantes y que es indispensable que tengas en cuenta a la hora de seleccionar el tipo de base de datos que vas a usar, estos conceptos son parte de lo que conocemos como Requisitos de Calidad o requerimientos no funcionales.

Los requerimientos no funcionales son aquellos atributos inherentes a la operación del sistema y de su comportamiento. Este tipo de atributos es importante definirlos desde el comienzo del desarrollo del proyecto porque es a partir de ellos que se toman las decisiones mas costosas del proyecto.

Por ejemplo: ¿vas a desarrollar un proyecto en el que la tasa de crecimiento de usuarios es del 50% mensual o es del 5% anual?, necesitas que tu aplicación soporte transaccionalidad o es solo un sitio de consulta?, este tipo de preguntas definen el rumbo de la arquitectura de tu proyecto.

Pero, ¿qué tiene esto que ver con la selección de la base de datos que vas a usar en tu proyecto? Tiene mucho que ver, y para esto vamos a hablar de tres atributos de calidad que servirán de base para la selección de tu base de datos:

  • Consistencia: La consistencia nos garantiza que una lectura nos retornará la escritura mas reciente de un registro dado. Lo que esto implica es que siempre que se haga alguna modificación a un dato dicho cambio debe reflejarse en todos los nodos de la base de datos, esto garantiza que siempre que se acceda a la información cualquiera de los nodos puede responder y la información siempre será la misma.

  • Disponibilidad: Un nodo en funcionamiento nos debe retornar una respuesta razonable en un periodo razonable de tiempo (Ni error ni timeout).

  • Tolerancia al Particionamiento: El sistema nos debe seguir funcionando aunque algunos nodos no se encuentren disponibles ya que la información es consistente en todos los nodos.

El Teorema CAP

En Ciencias de la Computación se enunció un teorema que nos dice que en un sistema distribuido de almacenamiento de datos no podemos garantizar consistencia y disponiblidad (para actualizaciones), al tiempo cuando el sistema sufre una partición (queda separado en dos o más islas). Este es el Teorema CAP, por Consistency (Consistencia), Availability (Disponibilidad) y Partition Tolerance (Tolerancia al Particionamiento).

Debemos tener en cuenta las exigencias de nuestro proyecto para saber qué atributos de calidad necesitamos y así elegir el tipo de base de datos que necesitaremos.

Lo que dice el teorema es que solo puedes garantizar dos de estos tres atributos,

CP (Consistencia y Tolerancia al particionamiento): Esto quiere decir que no se garantiza la disponibilidad, hay clientes que por ejemplo requieren que el sistema esté disponible 100% del tiempo o muy cerca, con bases de datos que cumplan con CP no es posible garantizar esto, no quiero decir que no se pueda lograr en cierto nivel, pero el sistema está enfocado en aplicar los cambios de forma consistente aunque se pierda comunicación con algunos nodos.

AP (Disponibilidad y Tolerancia al particionamiento): En este caso no se garantiza que los datos sean iguales en todos los nodos todo el tiempo, en este caso el sistema siempre estará disponible para las peticiones aunque se pierda la comunicación entre los nodos.

CA (Consistencia y disponibilidad): En este caso no se puede permitir el particionado de los datos, porque se garantiza que los datos siempre son iguales y el sistema estará disponible respondiendo todas las peticiones.

Por ejemplo, los sistemas de bases de datos relacionales (SQL de toda la vida) son CA porque todas las escrituras y lecturas se hacen sobre la misma copia de los datos.

Si en tu proyecto lo que requieres es que todos tus clientes tengan acceso a la misma vista de los datos en cualquier momento que sean requeridos (Consistencia) y además desde el comienzo sabes que se va a requerir disponibilidad de los datos en cercana al 100% del tiempo (Tolerancia al Particionamiento), el tipo de base de datos que deberías usar es una como MongoDB o Redis.

MongoDB

Bases de datos como MongoDB o Redis son llamadas bases de datos NoSQL o Not Only SQL, estas son tipos de bases de datos que se han optimizado para solventar diferentes necesidades en tus proyecto, por ejemplo MongoDB te proporciona velocidad en el almacenamiento y acceso a la información consistentemente y es realmente fácil, rápido y seguro implementar opciones de sharding y particionamiento, si quieres ver como hacerlo te invito a la clase en vivo de MongoDB.

Hay muchas otras implementaciones de bases de datos no relacionales, conocerlas y conocer sus capacidades te va a ayudar a elegir la que mejor se ajusta a tus necesidades, si te interesa ver algunas implementaciones reconocidas de bases de datos no relacionales te recomiendo el post de Implementación de bases de datos no relacionales en el que Yohan Graterol, profesor del Curso de MongoDB y Redis nos enseña sobre este tema.

En el curso de MongoDB y Redis veremos qué es NoSQL y porqué deberías usar este tipo de bases de datos en tus proyectos además aprenderás a utilizar MongoDB, uno de los motores de bases de datos NoSQL más importantes de la actualidad.

Yesica Lizeth
Yesica Lizeth
yesikita

10637Puntos

hace 6 años

Todas sus entradas
Escribe tu comentario
+ 2
Ordenar por:
10
1417Puntos

Muy buen artículo, es una pregunta que me había hecho al buscar implementar un sistema de BD, y al parecer este teorema es la respuesta para ese punto de partida! Gracias!!. Una observación: Me parece que hay una inconsistencia al final, en el párrafo ubicado ANTES DEL TÍTULO MONGODB,
Lo que si tiene lógica es la primera parte del texto:** “…requieres es que todos tus clientes tengan acceso a la misma vista de los datos en cualquier momento que sean requeridos (Consistencia)…” **
Pero luego se describe el siguiente concepto:** “…sabes que se va a requerir disponibilidad de los datos cercana al 100% del tiempo…”** Para mi lo que aquí se describe es el concepto de disponibilidad, sin embargo el texto lo asocia con (Tolerancia al Particionamiento). Esa es la parte que me confundió.

4
9267Puntos

Si en tu proyecto lo que requieres es que todos tus clientes tengan acceso a la misma vista de los datos en cualquier momento que sean requeridos (Consistencia) y además desde el comienzo sabes que se va a requerir disponibilidad de los datos en cercana al 100% del tiempo (Tolerancia al Particionamiento), el tipo de base de datos que deberías usar es una como MongoDB o Redis.

Creo que hay un error en este párrafo debido a que disponibilidad de los datos al 100% se refiere a Availability y no a Tolerancia al particionamiento

1
9267Puntos
3 años

Esto me dejó un poco confundido…

1
15140Puntos
2 años

tienes razon

2
3366Puntos

Muy interesante!

1
19568Puntos

Muchas gracias por el aporte, ayudará a complementar mis apuntes de clases

1
974Puntos

Me podrían indicar ejemplos de apps o websites que usen DB relacionales y no relacionales.
Creería que youtube, uber, rappi funcionan con DB no relacionales.
Y aplicaciones más empresariales con información de ventas o transacciones de clientes funcionan con DB relacionales.

Si alguien me puede aclarar esta duda, serpia genial.

1
28346Puntos

Que buen aporte, muy útil para seleccionar una base según el proyecto.

1
2199Puntos

Que interesante, muy útil y bien explicado

1
769Puntos

Muy interesante, apenas vine a comprender lo de NoSQL, gracias por la información

1
3062Puntos

¡Excelente artículo! Ahora tengo más curiosidad por aprender sobre Mongo DB 😊 ¡gracias!

1
11122Puntos

Pese al paso tiempo información muy valiosa! Mil Gracias…

1

Muy buen articulo! Me interesa mucho profundizar en el uso de MongoDB.

1
32980Puntos

Gracias Yesica por compartir!!! Muy útil ese triángulo, y demás.

1
9439Puntos

Súper aporte, muchas gracais!!!

1
5892Puntos

Interesante.

Gracias. 😃

1
6735Puntos

Excelente Yesikita, gracias

0
11276Puntos

Información de gran importancia.

0
10874Puntos

Muy buen artículo. Vine a verlo justo después de terminar el curso de fundamentos de bases de datos. Realmente permite ilustrar de manera clara los conceptos aprendidos.

0
69833Puntos

wowow super buen artículo, escondido en el pasado de Platzi! ¿Cuántas cosas increíbles habrá?