Concurrencia y Paralelismo en Python: `threading` y `multiprocessing`

Curso de Python

Contenido del curso

Fundamentos de Programación y Python

Colección y Procesamiento de Datos en Python

Control de Flujo en Python

Funciones y Manejo de Excepciones en Python

Programación Orientada a Objetos en Python

Lectura y escritura de archivos

Biblioteca estándar de Python

Conceptos avanzados de Python

Decoradores

Métodos y estructura de clases en Python

Programación concurrente y asíncrona

Creación de módulos y paquetes

Proyecto final

Tomar examen

Uso de threading y multiprocessing en Python

Imagina que estás trabajando en una aplicación que necesita procesar múltiples tareas al mismo tiempo: desde manejar solicitudes web hasta realizar cálculos complejos de manera simultánea. A medida que las aplicaciones se vuelven más exigentes, las soluciones básicas de concurrencia ya no son suficientes. Aquí es donde entran las herramientas avanzadas de Python como threading y multiprocessing, que te permiten sacar el máximo provecho de tu CPU y gestionar tareas de manera eficiente y sin errores.

En esta clase, aprenderás a manejar escenarios más complicados, como evitar que los hilos interfieran entre sí, compartir datos de manera segura entre procesos y prevenir bloqueos que puedan detener tu aplicación. Prepárate para llevar la programación concurrente y paralela a un nivel más profesional y resolver problemas que los desarrolladores enfrentan en proyectos del mundo real.

1. Sincronización de Hilos en Python

Cuando varios hilos intentan acceder a un mismo recurso al mismo tiempo, pueden ocurrir problemas de coherencia. Para evitar esto, se utilizan mecanismos de sincronización, como Lock y RLock, que garantizan que solo un hilo acceda a un recurso crítico a la vez.

Ejemplo: Uso de Lock para Evitar Condiciones de Carrera

import threading

# Variable compartida
saldo = 0
lock = threading.Lock()  # Crear un Lock

def depositar(dinero):
    global saldo
    for _ in range(100000):
        with lock:  # Bloquear el acceso para evitar condiciones de carrera
            saldo += dinero

hilos = []
for _ in range(2):
    hilo = threading.Thread(target=depositar, args=(1,))
    hilos.append(hilo)
    hilo.start()

for hilo in hilos:
    hilo.join()

print(f"Saldo final: {saldo}")  # Esperamos ver 200000 como saldo

Explicación:

El uso de Lock asegura que solo un hilo modifique la variable saldo en un momento dado, evitando que el resultado final sea incorrecto.

2. Compartir Datos entre Procesos con multiprocessing

A diferencia de los hilos, los procesos no comparten memoria de forma predeterminada. Para que dos procesos puedan compartir datos, Python proporciona herramientas como multiprocessing.Queue y multiprocessing.Value.

Ejemplo: Compartir Datos con Queue en multiprocessing

import multiprocessing

def calcular_cuadrado(numeros, cola):
    for n in numeros:
        cola.put(n * n)

if __name__ == "__main__":
    numeros = [1, 2, 3, 4, 5]
    cola = multiprocessing.Queue()

    proceso = multiprocessing.Process(target=calcular_cuadrado, args=(numeros, cola))
    proceso.start()
    proceso.join()

    # Extraer resultados de la cola
    while not cola.empty():
        print(cola.get())

Explicación:

Usamos Queue para que el proceso secundario pueda pasar datos de vuelta al proceso principal.

3. Problemas de Sincronización y Cómo Evitarlos

A medida que manejas tareas más complejas, es posible que te encuentres con problemas como deadlocks y race conditions. Entender estos problemas es crucial para escribir código concurrente robusto.

Evitar Deadlocks con RLock

Un deadlock ocurre cuando dos o más hilos se bloquean mutuamente al esperar por un recurso que está siendo utilizado por otro hilo. Para evitar esto, podemos usar RLock en lugar de Lock.

Ejemplo: Uso de RLock para Evitar Deadlocks

import threading

class CuentaBancaria:
    def __init__(self, saldo):
        self.saldo = saldo
        self.lock = threading.RLock()

    def transferir(self, otra_cuenta, cantidad):
        with self.lock:
            self.saldo -= cantidad
            otra_cuenta.depositar(cantidad)

    def depositar(self, cantidad):
        with self.lock:
            self.saldo += cantidad

cuenta1 = CuentaBancaria(500)
cuenta2 = CuentaBancaria(300)

hilo1 = threading.Thread(target=cuenta1.transferir, args=(cuenta2, 200))
hilo2 = threading.Thread(target=cuenta2.transferir, args=(cuenta1, 100))

hilo1.start()
hilo2.start()

hilo1.join()
hilo2.join()

print(f"Saldo cuenta1: {cuenta1.saldo}")
print(f"Saldo cuenta2: {cuenta2.saldo}")

Explicación:

Usamos RLock para evitar que múltiples operaciones simultáneas en una cuenta causen bloqueos.

4. Coordinación de Tareas con multiprocessing.Manager

Cuando los procesos deben compartir estructuras de datos complejas (como listas o diccionarios), podemos usar un Manager para crear un espacio de memoria compartido entre procesos.

Ejemplo: Uso de Manager para Compartir Listas entre Procesos

import multiprocessing

def agregar_valores(lista_compartida):
    for i in range(5):
        lista_compartida.append(i)

if __name__ == "__main__":
    with multiprocessing.Manager() as manager:
        lista_compartida = manager.list()

        proceso1 = multiprocessing.Process(target=agregar_valores, args=(lista_compartida,))
        proceso2 = multiprocessing.Process(target=agregar_valores, args=(lista_compartida,))

        proceso1.start()
        proceso2.start()

        proceso1.join()
        proceso2.join()

        print(f"Lista compartida: {lista_compartida}")

Explicación:

multiprocessing.Manager nos permite crear una lista compartida entre varios procesos, facilitando la comunicación entre ellos.

¡Lo lograste! Ahora tienes en tus manos poderosas técnicas para manejar múltiples tareas de forma eficiente. Aprendiste a sincronizar hilos para evitar errores, a compartir datos de manera segura entre procesos y a evitar bloqueos que podrían detener tus aplicaciones. Todo esto te prepara para enfrentar los desafíos del desarrollo de software moderno, donde la concurrencia y el paralelismo son esenciales para crear aplicaciones rápidas, eficientes y escalables.

Con estas herramientas avanzadas, tu código no solo será más rápido, sino también más robusto y confiable. Este es el tipo de conocimiento que te permite destacar en proyectos grandes y complejos. ¡Estás listo para aplicar todo lo que has aprendido y optimizar tus próximas creaciones en Python!

Concurrencia y Paralelismo en Python: `threading` y `multiprocessing`

Mario Alexander Vargas Celis

Estudiante

En Python, las bibliotecas threading y multiprocessing permiten ejecutar múltiples tareas en paralelo, pero tienen diferencias importantes. **threading** se usa principalmente para tareas de entrada/salida (I/O), como redes o acceso a archivos, debido a la limitación del **Global Interpreter Lock (GIL)**. **multiprocessing**, por otro lado, permite ejecutar código en múltiples procesos y es más adecuado para tareas que consumen mucha CPU, ya que evita el GIL.

A continuación, detallo cada biblioteca y su uso.

### 1. threading: Concurrencia a través de hilos

La biblioteca threading permite la creación y manejo de hilos en Python. Los hilos comparten el mismo espacio de memoria y recursos, lo que facilita la comunicación entre ellos, pero limita su uso en tareas intensivas en CPU debido al GIL.

#### Uso básico de threading


import threading



def tarea(nombre):

&#x20;   print(f"Iniciando {nombre}")

&#x20;   \# Simulación de trabajo

&#x20;   for i in range(3):

&#x20;       print(f"{nombre} ejecutando {i}")

&#x20;   print(f"Terminando {nombre}")



\# Crear hilos

hilo1 = threading.Thread(target=tarea, args=("Hilo 1",))

hilo2 = threading.Thread(target=tarea, args=("Hilo 2",))



\# Iniciar hilos

hilo1.start()

hilo2.start()



\# Esperar a que terminen

hilo1.join()

hilo2.join()

#### Ventajas y Limitaciones de threading

- **Ventajas**: Ideal para tareas de entrada/salida que pueden esperar (ej., operaciones de red, archivos).

- **Limitaciones**: Debido al GIL, solo un hilo puede ejecutar bytecode de Python a la vez, lo que limita la utilidad de threading para operaciones que consumen mucha CPU.

### 2. multiprocessing: Paralelismo con múltiples procesos

La biblioteca multiprocessing permite la ejecución de tareas en múltiples procesos, cada uno con su propio intérprete de Python, evitando el GIL. Esto es útil para tareas que requieren cálculos intensivos, como el procesamiento de datos.

#### Uso básico de multiprocessing


from multiprocessing import Process



def tarea(nombre):

&#x20;   print(f"Iniciando {nombre}")

&#x20;   \# Simulación de trabajo

&#x20;   for i in range(3):

&#x20;       print(f"{nombre} ejecutando {i}")

&#x20;   print(f"Terminando {nombre}")



\# Crear procesos

proceso1 = Process(target=tarea, args=("Proceso 1",))

proceso2 = Process(target=tarea, args=("Proceso 2",))



\# Iniciar procesos

proceso1.start()

proceso2.start()



\# Esperar a que terminen

proceso1.join()

proceso2.join()

#### Ventajas y Limitaciones de multiprocessing

- **Ventajas**: Permite un verdadero paralelismo, útil para tareas CPU intensivas. Cada proceso tiene su propio espacio de memoria y no está afectado por el GIL.

- **Limitaciones**: Cada proceso consume más memoria y tiene más sobrecarga en la comunicación entre procesos que los hilos.

### Comunicación entre Hilos y Procesos

#### threading: Comunicación a través de variables compartidas

En threading, los hilos pueden compartir variables y recursos de la misma clase, ya que todos operan en el mismo espacio de memoria. Es importante utilizar **bloqueos (locks)** para evitar problemas de sincronización.


import threading



contador = 0

bloqueo = threading.Lock()



def incrementar():

&#x20;   global contador

&#x20;   for \_ in range(1000):

&#x20;       with bloqueo:  # Bloqueo para evitar condiciones de carrera

&#x20;           contador += 1



\# Crear hilos

hilos = \[threading.Thread(target=incrementar) for \_ in range(5)]



\# Iniciar hilos

for hilo in hilos:

&#x20;   hilo.start()



\# Esperar a que terminen

for hilo in hilos:

&#x20;   hilo.join()



print(f"Contador final: {contador}")

#### multiprocessing: Comunicación a través de colas y pipes

Dado que los procesos no comparten memoria, multiprocessing proporciona colas (Queue) y pipes (Pipe) para la comunicación.


from multiprocessing import Process, Queue



def productor(q):

&#x20;   for i in range(5):

&#x20;       q.put(i)  # Añadir elementos a la cola

&#x20;       print(f"Producto {i} añadido a la cola")



def consumidor(q):

&#x20;   while not q.empty():

&#x20;       item = q.get()  # Obtener elementos de la cola

&#x20;       print(f"Producto {item} consumido")



cola = Queue()



\# Crear procesos

p1 = Process(target=productor, args=(cola,))

p2 = Process(target=consumidor, args=(cola,))



\# Iniciar procesos

p1.start()

p2.start()



\# Esperar a que terminen

p1.join()

p2.join()

### Cuándo usar threading vs multiprocessing

| **Situación** | **Biblioteca recomendada** |

|---------------------------------------------|----------------------------|

| Tareas I/O intensivas (red, lectura/escritura)| threading |

| Tareas CPU intensivas (procesamiento de datos)| multiprocessing |

| Necesidad de comunicación sencilla entre tareas | threading con variables compartidas y locks |

| Necesidad de aislamiento de datos | multiprocessing con Queue o Pipe |

### Resumen

- **threading** es ideal para tareas concurrentes y basadas en I/O donde el GIL no es un problema.

- **multiprocessing** permite el verdadero paralelismo y es mejor para tareas intensivas en CPU.

- La **comunicación** entre hilos se hace mediante variables compartidas y bloqueos, mientras que en multiprocessing se utilizan Queue y Pipe para compartir datos entre procesos.

Ambas bibliotecas son útiles para optimizar el rendimiento en Python, pero elegir la correcta depende del tipo de tarea y del diseño de la aplicación.

Concurrencia y Paralelismo en Python: `threading` y `multiprocessing`

Fundamentos de Programación y Python

Por qué Python se usa en misiones de la NASA

Este curso tiene una nueva versión, link para continuar aprendiendo

Instalación y Uso Básico de Python en Windows y Mac

Semántica y Sintaxis en Programación Python

Práctica: Te doy la bienvenida a los ejercicios interactivos

Manejo de Cadenas y Operaciones Básicas en Python

int, float y bool en Python

Dominio de la función `print` en Python: usos y formatos avanzados

Operaciones matemáticas avanzadas en Python: módulo, potencia y más

Entrada de información y manejo de tipos de datos en Python

Colección y Procesamiento de Datos en Python

Manipulación de Listas en Python: Creación, Indexación y Métodos Básicos

Copiar listas en Python con slicing

Manejo de Matrices y Tuplas en Python

Matrices en Juegos y Imágenes con Python

Diccionarios de Python con datos reales

Control de Flujo en Python

Estructuras Condicionales en Programación: Uso de If, Else y Elif

Bucles for y while en Python

Iteradores y Generadores en Python: Uso Eficiente de Memoria

Listas de Python en una sola línea

Funciones y Manejo de Excepciones en Python

Funciones en Python con calculadora real

Funciones Lambda en Python: Uso y Aplicaciones Prácticas

Recursividad en Python: Factoriales y Serie de Fibonacci

Manejo de Excepciones y Errores en Python

Programación Orientada a Objetos en Python

Programación Orientada a Objetos en Python: Clases y Métodos Básicos

Gestión de Biblioteca con Programación Orientada a Objetos

Herencia en Python con clases de vehículos

Programación Orientada a Objetos: Implementación de Clases y Herencia

Polimorfismo en Programación Orientada a Objetos

Herencia y Uso de la Función super() en Python

Programación Orientada a Objetos: Atributos, Métodos y `super()` en Python

Lectura y escritura de archivos

Manipulación de Archivos TXT y CSV en Python

Manipulación de archivos CSV con Python: lectura y escritura

Manejo de Archivos JSON en Python para Aplicaciones Web y APIs

Biblioteca estándar de Python

Uso Eficiente de la Biblioteca Estándar de Python

Uso de las librerías OS, Math y Random en Python

Estadística de ventas con Python y CSV

Desarrollo del juego Batalla Naval en Python

Conceptos avanzados de Python

Programación Avanzada en Python: POO, Excepciones y Proyectos

Qué es el código pythonico y PEP 8

Comentarios y Docstrings: Buenas Prácticas en Programación

Tiempo de vida y alcance de variables en Python

Anotaciones de Tipo en Python para Código Más Legible

Validación de Tipos y Manejo de Excepciones en Python

Estructuras de Datos Avanzadas en Python: Collection y Enumeraciones

Decoradores

Decoradores en Python: Extiende Funcionalidades de Funciones

Decoradores anidados con parámetros en Python

Decoradores de clase en Python OOP

Métodos y estructura de clases en Python

Uso de Métodos Mágicos en Python

Sobrecarga de Operadores en Python: Personaliza Comportamiento de Clases

`if __name__ == "__main__"` en Python

`__new__` vs `__init__` en Python

Uso de *args y **kwargs en funciones de Python

Métodos y Atributos Privados y Protegidos en Python

Getter, setter y deleter con @property

Métodos estáticos y de clase en Python

Programación concurrente y asíncrona

Concurrencia y Paralelismo en Python: Técnicas y Librerías Básicas