Concurrencia vs Paralelismo: Threads en Ruby

Concurrencia VS Paralelismo

Los términos concurrencia y paralelismo pueden ser fácilmente confundidos. Por un lado 2 tareas se ejecutan en paralelo cuando ambas se ejecutan en unidades de procesamiento independientes al mismo tiempo, es decir, ambas tareas pueden comenzar exactamente al mismo tiempo pues su ejecución es manejada por dos unidades de procesamiento diferente. Por otro lado, dos tareas se ejecutan concurrentemente cuando se pueden ejecutar en la misma unidad de procesamiento intercalando subtareas de ambas tareas.

Por ejemplo:

Hay una empresa que está desarrollando un blog como una aplicación web. Para esto necesita desarrollar el backend y el frontend para lo cual contrata a un desarrollador fullstack llamado Pepe que se puede encargar de ambas tareas. Pepe entonces tiene 2 tareas, hacer el backend y hacer el frontend, y a su vez estas 2 tareas se pueden dividir en pequeñas subtareas así:

Backend
- API para la autenticación
- CRUD de posts
Frontend
- Vista de autenticación
- Vista de los posts

Pepe puede trabajar en ambas tareas concurrentemente pues puede primero hacer una versión inicial de la implementación del API para la autenticación. Mientras su líder técnico revisa el código de esta versión inicial, Pepe puede comenzar a implementar la vista de autenticación y una vez su líder técnico termine la revisión de la versión inicial del API de autenticación, puede continuar con esta tarea y repetir el mismo proceso hasta terminar con todas las subtareas y tareas.

Si la empresa contrata a un desarrollador frontend y a un desarrollador backend, ambos desarrolladores pueden trabajar en ambas tareas en paralelo. Pues ambos pueden comenzar con ambas tareas al tiempo. En este ejemplo los desarrolladores son las unidades de procesamiento y el desarrollo del backend y frontend son las tareas que se pueden ejecutar en diferentes threads o unidades de procesamiento. Ahora un ejemplo gráfico:

Tomado de: https://joearms.github.io/published/2013-04-05-concurrent-and-parallel-programming.html

Limitaciones de concurrencia en Ruby

En Ruby tenemos la posibilidad de crear Threads, sin embargo, su comportamiento depende del intérprete que utilicemos. El interprete que usamos en el curso que adicionalmente es el interprete más popular (cruby o MRI) no permite paralelismo asi el computador en el que ejecutemos nuestro programa tenga múltiples cores en su procesador. MRI utiliza un mecanismo llamado Global Interpreter Lock (GIL) que hace que el interprete solo pueda ejecutar un Thread a la vez. Esto es una decisión que tomaron quienes diseñaron el lenguaje pues es una manera relativamente sencilla de evitar race conditions, deadlocks y otros problemas comunes que surgen cuando se está haciendo programación concurrente o en paralelo.

Aunque el GIL no permite que multiples threads se ejecuten, sí permite cambiar de contexto cuando se esta realizando una operación por fuera del interprete como operaciones de lectura o escritura. Como estas operaciones suceden por fuera del interprete, cruby permite cambiar de contexto para ejecutar otro thread mientras estas operaciones terminan y de esta manera se puede hacer programacion concurrente.

Otros interpretes como JRuby y Rubinius no tienen un GIL así que permiten ejecución en paralelo.

Threads en Ruby

En este ejemplo estamos simulando hacer 3 llamados HTTP. Cada llamado toma 3 segundos y estamos ejecutando estos llamados con y sin threads. Aunque el GIL no permite la ejecución en paralelo de múltiples threads, como la operación HTTP debe esperar un segundo por la respuesta (este comportamiento es simulado usando "sleep(1)"), el interprete puede cambiar de contexto y ejecutar los demás threads que necesiten ser ejecutados. De esta manera podemos ver que la ejecución sin threads toma 3 segundos pues ejecuta los 3 llamados en serie, sin embargo la ejecución que utiliza threads solo toma 1 segundo pues tan pronto un thread llama al método sleep, el interprete detecta que debe esperar así que puede cambiar de contexto y permitir la ejecución de los otros 2 threads.

A tener en cuenta

Para inicializar un Thread se utiliza debe crear un objeto Thread con Thread.new y pasarle un bloque en donde definimos lo que se debe ejecutar.
El punto de entrada de un programa Ruby se ejecuta en un thread principal o "main thread". Tan pronto este thread termina, la ejecución de todo el programa es terminado, así que si creamos varios threads pero el "main thread" finaliza primero los otros threads van a ser terminados. Para evitar esto debemos hacer "join" de los threads adicionales. Join es un mecanismo que hace que el thread principal espere a la finalizacion del thread al que se le hace join lo que podemos ver en la linea " threads.map(&:join)".

Referencias:

https://github.com/simon0191/platzi-curso-ruby/commit/8497e9ace3011767355fb814a473c39f896dfe67 https://www.toptal.com/ruby/ruby-concurrency-and-parallelism-a-practical-primer https://joearms.github.io/published/2013-04-05-concurrent-and-parallel-programming.html https://medium.com/@franzejr/ruby-3-mri-and-gil-a302577c6634 https://robots.thoughtbot.com/untangling-ruby-threads

Deyvi Conde

student•

Resumen: Imagina que vas al super Concurrencia: 1 solo cajero atiende a 3 clientes (debe atender un momento al cliente A, otro momento al cliente B y otro rato al cliente C). Puede parecer algo "lento" y aunque no atiende a todos al mismo momento, fin y al cabo "está atendiendo a los 3".

Paralelismo: 3 cajeros atienden a 3 clientes, cada cajero atiende a un cliente en el mismo instante. Fin de la historia.

Cristóbal De la Piedra

student•

Grande maestro, me ahorraste un bodrio.

Alan Hurtarte

student•

Deberían mejorar el contraste de las imágenes. Leyendo de noche quede así o.O

Sebastian Medina

student•

Ojo, Ruby no utiliza los "Thread del sistema operativo" ya que no usa paralelismo (MRI), utiliza "Green Threads". me explico. El sistema operativo usa un "Sheduler" que es quien le da tiempo de CPU y orden a las tareas que pasan por la CPU y sus cores, osea llega una tarea y el Sheduler dice ok a esta tarea de doy 10 mili segundos (tiempo variable) y cuando pasa ese tiempo, toma otra tarea, pero si la tarea inicial no se termino de resolver después el scheduler la toma otra vez y le da otro tiempo más.

el Scheduler del sistema operativo tira en este caso a Ruby por un proceso(Hilo). Ruby por dentro, tiene su propio Scheduler para gestionar los hilos verdes que uno crea y de la misma manera que el S.O osea con tiempo y orden, esto ocurre tan rápido que nos da la impresión de que se están haciendo tareas a la vez... pero no.

En cuanto al cambio de Contexto es cuando el "Scheduler" toma una tarea, le da tiempo y se termina y toma otra (cambio de contexto)

Ahora como yo entendí Concurrencia y Paralelismo

Concurrencia es "Concurrir" por ejemplo: 50 personas se conectan a la base de datos, ocurre concurrencia... ah y si no concurre nada, el sistema se queda esperando... concurrencia.

Paralelismo es "en Paralelo" estas conexiones se atienden en distintos lugares a la vez del procesador del equipo. pero MRI no hace esto.

PD: en Python pasa lo mismo usa Hilos Verdes, en otros lenguajes les llaman Fibras, en C# se le llama Task, pero sí hay otros Lenguajes que utilizan llamadas a los Hilos del S.O

Fuente de Información: Me lo explico un amigo llamado Nicolas Merino =)

Juan Castro

teacher•

🎨 Tambien te recomiendo esta lectura si quieres trabajar con Paralelismo y Concurrencia en JavaScript 👌:

Javascript Asíncrono: La guía definitiva

Daniel De Lauretis

student•

Hola Juan! creo que es el primer comentario de un profesor que veo en todo el curso. Este curso necesita un update urgente. hay cosas muy mal explicadas. Tiene muy poca organizacion este curso de Ruby.

Abner Daniel Saavedra Farías

student•

Muy buena explicación, al usar thread o hilo de ejecución es mas rápido porque se implementa la concurrencia de ejecución de tareas ahora mi duda es: ¿usando thread la ejecución la realiza la unidad de procesamiento usando concurencia y sin hilos ejecuta las instrucciones de manera secuencial?

Ricardo Celis

teacher•

ejecuta secuencial las intrucciones de cada thread

Daniel Alejandro Cumaco Robayo

student•

En ruby no hay manera directa de ejecutar desde un programa multi-threading (paralelismo real), a menos de que se utilice una JVM por medio de Jruby la cual no utiliza el GIL, aunque es cirteo que ruby en su version 19+ perimite a un programa poder comunicarse con varios hilos del SO, siempre esta el cuello de botella del GIL, la unica manera de ejecutar paralelismo (real no simulado) usando MRI, es creando diferentes programas de ruby a la cual cada programa le es asignado un diferente GIL, por lo cual, tendras que partir tu programa en varios subprogramas y comunicarlos, esto tiene sus beneficios, ya que permites que tu programa sea mas escalable

Noé Lara

student•

Paralelismo implica concurrencia, pero concurrencia no implica paralelismo. ;)

Eduardo Vera Sánchez

student•

Muy buena explicación.

Mario Vizcaino

student•

Muy buena información sobre concurrencia y paralelismo, me quedo todo claro.

Ramón Torres

student•

Me fue de mucha ayuda la explicación, gracias!

Victor Manuel Franco Cañon

student•

Excelente explicación

Eduardo Flores

student•

Gran información en este articulo

Concurrencia vs Paralelismo: Threads en Ruby

Introducción

Lo que aprenderás sobre Ruby

Qué es Ruby y para qué sirve este lenguaje

Instalación de Ruby

Bases del lenguaje

Tipos de datos I: Integer, float

Tipos de datos II: Strings

Tipos de datos III: Symbols

Tipos de datos IV: Arrays

Tipos de datos V: Hashes

Uso de condicionales

Uso de ciclos

Rangos

Uso de Regex

Procs y lambdas

Programación Orientada a Objetos en Ruby Comenzando la creación de nuestra clase

Programación Orientada a Objetos en Ruby: Módulos

Programación Orientada a Objetos: Clases y Objetos

Concurrencia vs Paralelismo: Threads en Ruby

Bundler y gemas

Testing en Ruby

Testing con MiniTest

Diferencias entre Ruby 2.5 y 3

Proyecto

Introducción al proyecto

Instalar Ruby 2D

Overview Ruby 2D

Arquitectura

Estructurando el proyecto

Vista básica

Programando la base para los movimientos

Programando el movimiento de nuestro snake

Test de nuestras acciones

Implementando el timer del movimiento

Actualizando la vista

Preparando el cambio de dirección

Recapitulación de la arquitectura

Moviendo la serpiente con el teclado

Creciendo la serpiente y programando la condición de derrota

Generando comida aleatoria: uso de rand y stub en pruebas

Condición de salida y conclusiones

Retos del curso