Platzi
Platzi

¡Invierte en ti y celebremos! Adquiere un plan Expert o Expert+ a precio especial.

Antes: $349
$259
Currency
Antes: $349
Ahorras: $90
COMIENZA AHORA
Termina en: 18D : 11H : 6M : 58S

Debes tener cuenta en Platzi

Para ver esta clase abierta debes iniciar sesión

Atributos: Confiabilidad7/43

Atributos que tienen que tienen que ver con el uso normal del sistema a través del tiempo:

  • Madurez, cómo medimos cuánto falla el sistema en su operación normal, la forma de medirlo es usando el tiempo medio entre averías, cuánto más tiempo pase, más maduro va a ser el sistema.

  • Disponibilidad, % de tiempo en el que el sistema está disponible con respecto al ciclo de vida del sistema mismo. La disponibilidad incluso suele estar asociada a contratos.

  • Tolerancia a fallos, chaos testing.

  • Capacidad de recuperación, qué tanto el sistema puede estar disponible hasta que se recupera de un fallo, se mide a través del tiempo medio que pasa entre la caída del servicio y la recuperación del sistema.

Confiabilidad
Atributos que tienen que tienen que ver con el uso normal del sistema a través del tiempo:
• Madurez, El grado en que un sistema, producto o componente satisface necesidades de confiabilidad bajo operación normal.
Ej: Sistemas de compras. Sistemas bancarios.
• Disponibilidad, Grado en el cual un sistema, producto o componente es operacional y accesible cuando se requiere su uso.
Ej: SLAs, contratos de servicio. Sistemas con eventos de carga pico puntuales.
• Tolerancia a fallos, Grado en el que un sistema, producto o componente funciona según lo previsto a pesar de la presencia de fallas de hardware o software.
Ej Aplicaciones móviles.
• Capacidad de recuperación, Grado en el que, en caso de interrupción o falla, un producto o sistema puede recuperar los datos directamente afectados y restablecer el estado deseado del sistema.
Ej Sistemas distribuidos, configuraciones auto-escalables en la nube. Puede estar conectado a la mantenibilidad.

Aporto en mas detalle cómo se ve representado el porcentaje en tiempo offline ya sea año / mes / día. Me parece importante por que cuando se firma un contrato de disponibilidad hay que ser consciente de lo que realmente se está garantizando

¿Cómo medimos la disponibilidad?

De primera instancia, todo sistema debe tener establecido un Acuerdo de Nivel de Servicio (Service Level Agreement – SLA) que defina cuánto tiempo y en qué horarios debe estar en línea. En el caso de aplicaciones de baja criticidad, dicho SLA puede ser de 8×5 horas a la semana excluyendo días festivos; para sistemas con mayor criticidad como una red de cajeros automáticos se tienen niveles de servicio que alcanzan las 24 horas al día, los 365 días del año. Así entonces, suponiendo un sistema con un SLA de 24×365 podríamos calcular su disponibilidad de la siguiente manera:

Disponibilidad = ((A – B)/A) x 100 por ciento)

Donde:

A = Horas comprometidas de disponibilidad: 24 x 365 = 8,760 Horas/año.

B = Número de horas fuera de línea (Horas de “caída del sistema” durante el tiempo de disponibilidad comprometido). Por ejemplo: 15 horas por falla en un disco; 9 horas por mantenimiento preventivo no planeado.

así entonces:

Disponibilidad = ((8,760 – 24)/8,760) x 100 por ciento) = 99.726%

Confiabilidad
Es el atributo que permite usar el sistema a través del tiempo de forma normal. Esto se logra con las siguientes características:

  • Madurez: Es lo que se percibe entre las fallas del sistema, entre mas tiempo, mas maduro el sistema, pues menos averías se encuentran.
  • Disponibilidad: Es el tiempo que se encuentra disponible el sistema en un espacio de tiempo, se puede medir por la cantidad de tiempo que permanece fuera de servicio, son sistemas fácil de medir y extremadamente importantes de cuidar.
  • Tolerancia a fallos: Hace referencia a cómo el sistema puede seguir dando servicio a pesar de que exista un fallo intrasistema o intersistema, para medirlo necesitamos generar esos fallos y entender cómo se comporta nuestro sistema con ellos.
  • Capacidad de recuperación: Es el tiempo que requiere el sistema para poder volver a servicio tras un fallo.

Acá un articulo acerca de principios de la ingenieria del caos o Chaos Testing
https://principlesofchaos.org/

Confiabilidad:
Se trata de cuanto el sistema nos permite utilizarlo a través del tiempo de forma normal. Para analizarlo utilizamos 4 características:


  • Madurez: Cuanto falla el sistema. Para medirla, se toma el tiempo entre cada fallo que haya tenido el sistema. Cuanto más tiempo pase, más maduro es el sistema.

  • Disponibilidad: Cuanto tiempo esta fuera de servicio el sistema con respecto a su ciclo de vida normal. Para medirlo, igualmente tomamos el tiempo que estuvo fuera y lo expresamos en una forma de porcentaje.

  • Tolerancia a fallos (Resilencia): Como el sistema se mantiene dando el servicio a pesar de que tenga un fallo o haya un fallo con la conexión a un sistema externo. Para medirlo hay que generar los fallos y ver como se comporta.

  • Capacidad de recuperación: Cuanto tiempo el sistema puede seguir estando disponible, luego de algún fallo. Para medirlo, guardamos el tiempo que el sistema vuelve a dar el servicio una vez que salio por un fallo.

Apuntes:

Confiabilidad

Madurez. Cuánto falla el sistema en su uso normal, cuánto menos falle consideraremos más maduro el sistema. Para medir se usa el tiempo medio entre averías.

Disponibilidad. Cuánto tiempo está fuera de servicio el sistema con respecto a su ciclo de vida normal.

Tolerancia a fallos. Cómo el sistema puede seguir dando servicio por más que haya un fallo en el contexto del sistema o en la interacción del sistema y otros sistemas independientes. Para medirlo necesitamos poder generar esos fallos y ver cómo se comporta el sistema.

Capacidad de recuperación. Cuánto el sistema puede seguir estando disponible luego de un fallo. Para medir esto usamos el tiempo medio hasta la recuperación.

Confiabilidad
Cuanto el sistema nos permite a través del tiempo usarlo de forma normal

  • Madurez -> Cuanto menos falle más maduro es.
  • Disponibilidad -> Cuanto tiempo esta fuera de servicio en su uso normal.
  • Tolerancia a fallos -> Como el sistema puede seguir dando servicio por más que exista un fallo
  • Capacidad de recuperación -> Cuanto el sistema puede seguir disponible luego de un fallo.

un dia estaba realizando un pago por PSE, descontando de mi saldo pero no abono a la cuenta a la cual estaba pagando, pero el pago se efectuó al día siguiente, muy apesar que se presento la pantalla de error. creo que esto aplica para el tema de la confiabilidad , ya que la pasarela de pago debe garantizar 100% la entrega de ese dinero. o en su defecto la devolución, para dejar la operación en un estado consistente.

Este ha sido el atributo que mejor he entendido!

Atributos que tienen que tienen que ver con el uso normal del sistema a través del tiempo:

Madurez, cómo medimos cuánto falla el sistema en su operación normal, la forma de medirlo es usando el tiempo medio entre averias, cuánto mas tiempo pase, mas maduro va a ser el sistema.

Disponibilidad, % de tiempo en el que el sistema esta disponible, con respecto al ciclo de vida del sistema mismo. La disponibilidad incluso suele estar asociada a contratos.

Tolerancia a fallos, chaos testing.

Capacidad de recuperación, que tanto el sistema puede estar disponible hasta que se recupera de un fallo, se mide a traves del tiempo medio que pasa entre la caída del servicio y la recuperación del sistema.

Muy Claro

En la parte de final del vídeo cuando se menciona a Amazon, ¿no sería un IAAS ? ,Ya que guido menciona que es una PAAS.

importante en el marco de la definición de cualquier sistema

La confiabilidad de un sistema se mide con las siguientes características: Madurez Disponibilidad (regla de los 6 nueves) Resiliencia Capacidad de recuperación

Madurez: Cuanto tiempo hay entre fallas?
Disponibilidad: Qué cantidad de tiempo esta el sistema corriendo?
Tolerancia: Cuanto puede el sistema seguir funcionando a pesar de fallos?
Capacidad de recuperación: Cuanto tiempo tarda en recuperarse después de un fallo?

Atributo de calidad de confiabilidad

-Madurez
¿Cuánto falla en su uso normal? Se mide sabiendo el timpo entre cada fallo.

-Disponibilidad
¿Cuánto tiempo está fuera de servicio?

-Tolerancia a fallos
¿Puede seguir dando servicio con algunos fallos?

-Capacidad de recuperación
¿Cuánto tiempo demora en volver a dar servicio?

Comparto link para los que quieran profundizar un poco más en el CHAOS TESTING link: https://www.pagerduty.com/resources/learn/what-is-chaos-testing/

Confiablidad (cuanto el sistema nos permite a traves del tiempo usarlo de forma normal)-> Madurez (Erorres del sistema, tiempo entre averias), Disponibilidad (Cuanto tiempo esta fuera el servicio el sistema), Tolerancia a fallos(como pued seguir dando servicio durante un fallo), Capacidad de recuperacion (Cuanto puede seguir estando desiponible despues de un fallo, tiempo medio de recuperacion)

Confiabilidad
Atributos que tienen que tienen que ver con el uso normal del sistema a través del tiempo:
• Madurez, El grado en que un sistema, producto o componente satisface necesidades de confiabilidad bajo operación normal.
Ej: Sistemas de compras. Sistemas bancarios.
• Disponibilidad, Grado en el cual un sistema, producto o componente es operacional y accesible cuando se requiere su uso.
Ej: SLAs, contratos de servicio. Sistemas con eventos de carga pico puntuales.
• Tolerancia a fallos, Grado en el que un sistema, producto o componente funciona según lo previsto a pesar de la presencia de fallas de hardware o software.
Ej Aplicaciones móviles.
• Capacidad de recuperación, Grado en el que, en caso de interrupción o falla, un producto o sistema puede recuperar los datos directamente afectados y restablecer el estado deseado del sistema.
Ej Sistemas distribuidos, configuraciones auto-escalables en la nube. Puede estar conectado a la mantenibilidad.

Aporto en mas detalle cómo se ve representado el porcentaje en tiempo offline ya sea año / mes / día. Me parece importante por que cuando se firma un contrato de disponibilidad hay que ser consciente de lo que realmente se está garantizando

¿Cómo medimos la disponibilidad?

De primera instancia, todo sistema debe tener establecido un Acuerdo de Nivel de Servicio (Service Level Agreement – SLA) que defina cuánto tiempo y en qué horarios debe estar en línea. En el caso de aplicaciones de baja criticidad, dicho SLA puede ser de 8×5 horas a la semana excluyendo días festivos; para sistemas con mayor criticidad como una red de cajeros automáticos se tienen niveles de servicio que alcanzan las 24 horas al día, los 365 días del año. Así entonces, suponiendo un sistema con un SLA de 24×365 podríamos calcular su disponibilidad de la siguiente manera:

Disponibilidad = ((A – B)/A) x 100 por ciento)

Donde:

A = Horas comprometidas de disponibilidad: 24 x 365 = 8,760 Horas/año.

B = Número de horas fuera de línea (Horas de “caída del sistema” durante el tiempo de disponibilidad comprometido). Por ejemplo: 15 horas por falla en un disco; 9 horas por mantenimiento preventivo no planeado.

así entonces:

Disponibilidad = ((8,760 – 24)/8,760) x 100 por ciento) = 99.726%

Confiabilidad
Es el atributo que permite usar el sistema a través del tiempo de forma normal. Esto se logra con las siguientes características:

  • Madurez: Es lo que se percibe entre las fallas del sistema, entre mas tiempo, mas maduro el sistema, pues menos averías se encuentran.
  • Disponibilidad: Es el tiempo que se encuentra disponible el sistema en un espacio de tiempo, se puede medir por la cantidad de tiempo que permanece fuera de servicio, son sistemas fácil de medir y extremadamente importantes de cuidar.
  • Tolerancia a fallos: Hace referencia a cómo el sistema puede seguir dando servicio a pesar de que exista un fallo intrasistema o intersistema, para medirlo necesitamos generar esos fallos y entender cómo se comporta nuestro sistema con ellos.
  • Capacidad de recuperación: Es el tiempo que requiere el sistema para poder volver a servicio tras un fallo.

Acá un articulo acerca de principios de la ingenieria del caos o Chaos Testing
https://principlesofchaos.org/

Confiabilidad:
Se trata de cuanto el sistema nos permite utilizarlo a través del tiempo de forma normal. Para analizarlo utilizamos 4 características:


  • Madurez: Cuanto falla el sistema. Para medirla, se toma el tiempo entre cada fallo que haya tenido el sistema. Cuanto más tiempo pase, más maduro es el sistema.

  • Disponibilidad: Cuanto tiempo esta fuera de servicio el sistema con respecto a su ciclo de vida normal. Para medirlo, igualmente tomamos el tiempo que estuvo fuera y lo expresamos en una forma de porcentaje.

  • Tolerancia a fallos (Resilencia): Como el sistema se mantiene dando el servicio a pesar de que tenga un fallo o haya un fallo con la conexión a un sistema externo. Para medirlo hay que generar los fallos y ver como se comporta.

  • Capacidad de recuperación: Cuanto tiempo el sistema puede seguir estando disponible, luego de algún fallo. Para medirlo, guardamos el tiempo que el sistema vuelve a dar el servicio una vez que salio por un fallo.

Apuntes:

Confiabilidad

Madurez. Cuánto falla el sistema en su uso normal, cuánto menos falle consideraremos más maduro el sistema. Para medir se usa el tiempo medio entre averías.

Disponibilidad. Cuánto tiempo está fuera de servicio el sistema con respecto a su ciclo de vida normal.

Tolerancia a fallos. Cómo el sistema puede seguir dando servicio por más que haya un fallo en el contexto del sistema o en la interacción del sistema y otros sistemas independientes. Para medirlo necesitamos poder generar esos fallos y ver cómo se comporta el sistema.

Capacidad de recuperación. Cuánto el sistema puede seguir estando disponible luego de un fallo. Para medir esto usamos el tiempo medio hasta la recuperación.

Confiabilidad
Cuanto el sistema nos permite a través del tiempo usarlo de forma normal

  • Madurez -> Cuanto menos falle más maduro es.
  • Disponibilidad -> Cuanto tiempo esta fuera de servicio en su uso normal.
  • Tolerancia a fallos -> Como el sistema puede seguir dando servicio por más que exista un fallo
  • Capacidad de recuperación -> Cuanto el sistema puede seguir disponible luego de un fallo.

un dia estaba realizando un pago por PSE, descontando de mi saldo pero no abono a la cuenta a la cual estaba pagando, pero el pago se efectuó al día siguiente, muy apesar que se presento la pantalla de error. creo que esto aplica para el tema de la confiabilidad , ya que la pasarela de pago debe garantizar 100% la entrega de ese dinero. o en su defecto la devolución, para dejar la operación en un estado consistente.

Este ha sido el atributo que mejor he entendido!

Atributos que tienen que tienen que ver con el uso normal del sistema a través del tiempo:

Madurez, cómo medimos cuánto falla el sistema en su operación normal, la forma de medirlo es usando el tiempo medio entre averias, cuánto mas tiempo pase, mas maduro va a ser el sistema.

Disponibilidad, % de tiempo en el que el sistema esta disponible, con respecto al ciclo de vida del sistema mismo. La disponibilidad incluso suele estar asociada a contratos.

Tolerancia a fallos, chaos testing.

Capacidad de recuperación, que tanto el sistema puede estar disponible hasta que se recupera de un fallo, se mide a traves del tiempo medio que pasa entre la caída del servicio y la recuperación del sistema.

Muy Claro

En la parte de final del vídeo cuando se menciona a Amazon, ¿no sería un IAAS ? ,Ya que guido menciona que es una PAAS.

importante en el marco de la definición de cualquier sistema

La confiabilidad de un sistema se mide con las siguientes características: Madurez Disponibilidad (regla de los 6 nueves) Resiliencia Capacidad de recuperación

Madurez: Cuanto tiempo hay entre fallas?
Disponibilidad: Qué cantidad de tiempo esta el sistema corriendo?
Tolerancia: Cuanto puede el sistema seguir funcionando a pesar de fallos?
Capacidad de recuperación: Cuanto tiempo tarda en recuperarse después de un fallo?

Atributo de calidad de confiabilidad

-Madurez
¿Cuánto falla en su uso normal? Se mide sabiendo el timpo entre cada fallo.

-Disponibilidad
¿Cuánto tiempo está fuera de servicio?

-Tolerancia a fallos
¿Puede seguir dando servicio con algunos fallos?

-Capacidad de recuperación
¿Cuánto tiempo demora en volver a dar servicio?

Comparto link para los que quieran profundizar un poco más en el CHAOS TESTING link: https://www.pagerduty.com/resources/learn/what-is-chaos-testing/

Confiablidad (cuanto el sistema nos permite a traves del tiempo usarlo de forma normal)-> Madurez (Erorres del sistema, tiempo entre averias), Disponibilidad (Cuanto tiempo esta fuera el servicio el sistema), Tolerancia a fallos(como pued seguir dando servicio durante un fallo), Capacidad de recuperacion (Cuanto puede seguir estando desiponible despues de un fallo, tiempo medio de recuperacion)