Ajustando un modelo epidemiológico a datos reales

12/12

Lectura

Antes de discutir el objetivo y paso a paso del proyecto final de este curso, necesitamos consolidar el manejo de ciertos ingredientes que serán fundamentales para lograr con éxito la ejecución de este gran ejercicio de modelado matemático.

Ingredientes previos: para la ejecución de este proyecto final necesitamos de tres ingredientes esenciales, que son:

  1. Un modelo que considere un compartimiento poblacional que corresponda a personas que mueren por causa de la epidemia.
  2. Datos reales para usar como referencia y a los cuales se les ajusta el modelo matemático.
  3. Un algoritmo que nos permita ejecutar el ajuste del modelo matemático a los datos reales (algoritmo de evolución diferencial).

1. Modelo SIRD

El modelo SIRD (por sus siglas en inglés: susceptibles, infected, recovered and dead) es una mejora adicional al modelo que refinamos en la clase anterior. Este modelo ahora contiene cuatro compartimentos y por tanto, cuatro variables en función del tiempo:

Screenshot_80.png

Con esto, tenemos ahora un modelo con tres parámetros (β, μ, σ) donde ahora σ representa la tasa a la cual crece la población de fallecidos.

Aquí encuentras un notebook de ejemplo, sobre cómo implementar el modelo SIRD siguiendo estructuras de código similares a las desarrolladas previamente en el curso.

2. Repositorio de Datos sobre el Covid 19

La fuente de datos que usaremos para calibrar nuestros modelos es este repositorio en GitHub:

https://github.com/CSSEGISandData/COVID-19

En este notebook aprenderás a leer y transformar estos datos, para luego analizarlos y prepararlos para el ajuste con los modelos.

3. Algoritmo de Evolución diferencial

Este es un algoritmo de los que denominan evolutivos o adaptativos, usa ideas inspiradas en el concepto de evolución biológica para optimizar funciones cuyas derivadas matemáticas son difíciles de calcular. En este notebook aprenderás a usar este algoritmo con una filosofía tipo black-box, ya que no nos proponemos entender cada detalle del algoritmo sino solamente usarlo adecuadamente para el proceso de ajuste a un conjunto de datos.

Objetivo del proyecto: Construye un modelo epidemiológico que puedas ajustar a un conjunto de datos reales que describen la propagación del virus SARS-COV-2 en un país donde este tiene o tuvo presencia, siguiendo estos pasos:

  1. Ajusta un modelo SIRD (usando evolución diferencial) a la curva de contagio total de China con datos registrados hasta el 1 de Julio del 2020. ¿como hacer el ajuste?, bueno, la idea es que lo puedes hacer variando los parámetros del modelo (β, μ, σ). Aquí lo que hará el algoritmo de evolución diferencial es encontrar los valores óptimos de esos parámetros.
  2. Ajusta un modelo SIRD (usando evolución diferencial) a la curva de contagio total de una provincia de China con datos registrados hasta el 1 de Julio del 2020.
  3. Usa un modelo SIRD para predecir el pico máximo de contagios para un país que todavía no haya alcanzado el pico (si para el momento en que estás ejecutando este ejercicio ya todos los países han alcanzado un pico, entonces corta los datos hasta el 1 de Julio del 2020 y toma el país donde vives, probablemente para entonces aún no ha alcanzado el pico. Puedes ajustar el modelo con solamente esa parte de los datos y ver la proyección a futuro desde esa fecha, compara las proyecciones ajustadas con los datos reales para esas mismas fechas).

NOTA: Para lograr estos pasos con éxito, debes juntar los ingredientes que estudiaste en los notebooks anteriores y construir sobre estos un código tuyo que te permita hacer todo lo que el proyecto requiere.

Revisión de Resultados

  1. ¿Qué resultó más fácil, ajustar la curva total de China o la de una sola provincia? Investiga sobre las hipótesis de simplificación detrás del uso de EDOs para este tipo de problemas y revisa si esto es coherente con tus resultados.

    Pista: Los modelos que usamos asumen que el proceso de los contagios no involucra la distribución espacial de los individuos.

  2. ¿Tienen los parámetros óptimos (β, μ, σ), que resultan de la evolución diferencial, algún significado especial? ¿cuál crees que sea?

  3. ¿Lograste predecir con cierto nivel de error el pico máximo y el momento de ocurrencia del pico para el país cuyos datos usaste en el punto 3?

  4. Comparte tus resultados y análisis con tus compañeros y conmigo. No hay una manera única de desarrollar este proyecto así que será interesante ver las diferentes maneras en que cada uno lo resuelve.

Una vez completo este proyecto final, habrás aprendido los conceptos fundamentales detrás de todo proceso de modelado matemático. En la vida real siempre debemos tener presente que los modelos son aproximaciones y por lo tanto sus predicciones, aunque cuantitativas, no son exactas y pueden diferir de la realidad si las simplificaciones son significativas.

En el caso de la predicción del clima, el caos ya representa una barrera para lograr predicciones cada vez mejores ya que hay factores que siempre darán lugar a errores incontrolables. Por otro lado en el caso de la epidemiología, las curvas de los modelos estudiados son una base para ganar intuición sobre el comportamiento natural de una epidemia, pero en la realidad hay fuentes de error y de discrepancias como: mediciones incorrectas del número de individuos infectados, información incompleta o imperfecta, variaciones abruptas de las condiciones como un régimen de cuarentena, distanciamiento social o distribución heterogénea de individuos en una región dada.

A pesar de todas estas limitaciones, los modelos permiten desarrollar una práctica predictiva que ha permitido el progreso científico y tecnológico a un nivel que nuestros ancestros no hubieran podido imaginar: Aviones, telecomunicaciones, circuitos electrónicos, mecanismos de conversión de energía como paneles solares y fuentes hidroeléctricas, naves y sondas espaciales de exploración de espacio profundo, entre otros. El modelado matemático es un área que seguirá vigente mientras exista la raza humana, porque siempre tendremos la necesidad de predecir situaciones dentro de la realidad que nos rodea. Si en tu caso este camino apenas comienza, para poder entender modelos más complejos es preciso que desarrolles con mayor profundidad tus conocimientos matemáticos y de programación, para lo cual existen varias rutas de aprendizaje que pueden relacionarse con tu interés por los modelos matemáticos.

Si quieres aprender mucho más sobre estos temas, no olvides revisar todo lo que tenemos para ti en la Escuela de Data Science.

Muchas gracias por haberme acompañado en esta aventura de exploración científica y computacional. Espero que hayas disfrutado de los conocimientos compartidos a lo largo del camino y te espero en próximos cursos.

Aportes 2

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Buenísimo el taller

Muy genial el taller, si bien ya tenia conocimiento de EDO y algunos métodos de solución, en aplicados a python y a un modelo epidémico a sido una experiencia a otro nivel. En general creo que todo lo explicado es muy digerible, vamos a ver como sale el proyecto.