Modelizando la curva del coronavirus COVID-19

Modelos matemáticos para predecir el COVID_19 (coronavirus de Wuhan)

Ahora que estamos en medio de una pandemia de proporciones épicas con el coronavirus COVID-19 que se ha iniciado en Hubei, China, no he podido resistir la tentación de tratar de modelizar matemáticamente la evolución de esta pandemia. Entonces voy a mostrar como he planteado el problema,que parámetros he usado y ajustado y los resultados obtenidos.

PRIMERO ALGUNOS RESULTADOS

Para abrir boca muestro algunos resultados gráficos para el caso de España. Tengamos en cuenta que los resultados para España van reajustándose cada cierto número de días con los nuevos datos.

modelo mortalidad covid-19 España
Ajuste en escenario último (1,2% de letalidad) a 24 de mayo modelo 2.2
Modelo versión 2 para España para cumulado de muertes por COVID-19
modelo covid-19 España
Muertos reales versus estimados, versión 2.2, actualizado 26 de mayo

METODOLOGÍA DE PLANTEAMIENTO

Dado que la evolución en el número de casos registrados no es fiable como medida del número de contagios reales ya que depende mucho del número de tests que se realicen no uso el dato de casos confirmados en el modelo y basamos todo el cálculo en el número de muertes que es un dato más confiable.

Para estimar el número de casos de contagiados reales en un momento inicial tenemos en cuenta que el tiempo medio en morir desde que se produce el contagio es de tres semanas como ha aparecido publicado en diversos artículos

Además para el caso más optimista he supuesto que el porcentaje real de mortalidad no es el dato que se da en función de los casos actualmente contabilizados pues varía mucho desde casi un 10% en Italia al 0,4% de Alemania pensando que existen muchos más contagiados asintomáticos no localizados. Así para un escenario muy optimista he usado como referencia la mortalidad del la gripe A, el H1N1, que es de 0,021% ([1] Moretin y otros) multiplicándola por dos, 0,042%, y aumentándola para diversos escenarios según grado de optimismo hasta el 0,66% de un estudio. En un estudio de inmunidad en Alemania han llegado a la conclusión de que la mortalidad debe ser mucho menos a la observada pues hay mucha más gente que ha pasado la enfermedad asintomática y no fue detectada bajando el porcentaje de mortalidad real a 0,37% (noticia). Además según una noticia en Dinamarca el 3% de los donantes de sangre han resultado seropositivos en COVID-19, lo cual significaría unos 174000 daneses ya contagiados y para unos 320 fallecidos reportados en esas fechas (17/4/2020) significa cerca del 0,2% de mortalidad. Así los gráficos cambian mucho dependiendo del porcentaje de mortalidad que se asuma para el ajuste habiendo muchas posibilidades, pero valores cercanos a eso 0,2% pueden ser los adecuados.

Entonces a partir de un número de muertos algo inferior a 100 estimo el número de contagiados por coronavirus que habría 21 días (tiempo medio aproximado hasta la defunción: 17 +5 de incubación) antes y a partir de ahí se va calculando el nuevo número de contagiados de cada día aplicando un porcentaje de incremento diario inicial (esta es la segunda variable) que es corregido con otro factor (k) que es la fracción de población no contagiable (contagiados + inmunes o aislados) aplicado a la población total del país o región.

Combinando estas tres variables, mortalidad, incremento diario inicial y % de inmunes, ajustándolas, se obtiene una función de tipo «logística» que se adapta con bastante precisión a la curva de datos reales y permite una cierta capacidad predictiva.

fórmulas modelo coronavirus

fórmulas para la función logística simple de evolución del número de contagiados totales. E.p es el porcentaje inicial de crecimiento de la curva que va siendo corregido por el factor k que va descendiendo a medida que la población se va contagiando.  Modelo 1, estándar.

Con el paso de días los escenarios optimistas van fallando y vamos subiendo el porcentaje de muertes prevista (a 0,12% para el escenario optimista) y reajustando variables. Además el factor k de decrecimiento de probabilidad se ha comprobado con los datos reales que es insuficiente y los ajustes funcionan mejor si ese factor se eleva a una potencia con la que también experimentamos para obtener el mejor ajuste. Esto es debido a que la probabilidad de contagio decrece más rápido pues la movilidad no es infinita y los contactos se realizan con mayor probabilidad con cercanos ya contagiados que con lejanos sin contagiar.

Versión 2:

La versión 2 era difícil de ajustar para los datos del primer mes y por ello la dejábamos en reserva pero a partir de mayo la versión 1 ha dejado de funcionar correctamente. La cuarentena a demostrado que la versión 2 era mejor, 

En esta versión dejamos la potencia a la que elevamos el factor k al mínimo y añadimos otro factor reductor k2 que es el número de infecciosos existentes en un momento entre el número de casos acumulado de infectados. Esto es suponiendo que cuanto menos contagiosa es la masa total de infectados menos infectarán al resto de no infectados pues la mayoría de contactos serán entre ellos mismos.

Versión 2.2:

Con los datos iniciales sobre estudio de prevalencia en España se estima que sólo un 5% de la población española está contagiada a día 12 de mayo lo implicaría un 1,1 % de letalidad, que de hecho será superior ya que los datos sobre decesos a partir de las defunciones totales registradas se estiman superiores a los informados. Además en un estudio de Singapur se establece que el periodo medio que un contagiado es contagioso es de unos 11 días.

Con esto ajustamos el modelo 2, que se basaba en menor letalidad y mayor tiempo contagiando, y el modelo que mejor se ajusta lo bautizamos como v2.2, siendo el modelo de mayor probabilidad de éxito en este momento.

GRÁFICOS DEL CORONAVIRUS

Una de las mejores adaptación a los datos reales a día de 24 de mayo. versión 2.2 con una estimación de 1,2% de letalidad.
Versión 1 sin cuarentena para España
Uno de los primeros ajustes. Se ha demostrado NO válido, demasiado optimista, muy baja mortalidad estimada. Lo dejo aquí como recuerdo de ajuste fallido.
Una de las mejores estimaciones hasta el día 10 de Mayo usando 0,13% de mortalidad. v1
previsiones covid madrid
Modelo para la Comunidad de Madrid
Datos reales vs estimaciones para Corea
Estimación de muerte en China por covid-19 multiplicando por 10 la mortalidad (0,1% para Hubei)
Estimación para España en escala logarítmica con 0,12% de mortalidad v1
modelo covid-19 España
Estimación de muertes diarias versus datos reales, versión 2.2.
versión 2 de la estimación (con factor extra de descenso de pendiente).
previsiones COVID-19 para la COmunidad valenciana versión2
previsiones para la Comnidad Valenciana v2

DISCUSIÓN:

El gráfico de China nos da algunos datos interesantes. La mejor forma que he encontrado de aproximar la curva a los datos de mortalidad ha sido poniendo un porcentaje de mortalidad muy bajo, sólo un 0,01%. Con más mortalidad no consigo que las curva predicha se aproxime más, sólo se aleja. Hay que tener en cuenta que trato de ajustar la curva al porcentaje de muertos informados que puede ser bastante inferior a los reales pudiendo ser en realidad incluso 30 veces el informado. Sin embargo si multiplicamos la mortalidad por 10 y la subimos 0,1% suponiendo un inicio en 10 veces más muertes tenemos un gráfico paralelo en escala logarítmica con un parecido muy alto al gráfico de España. Igualmente el número de contagiados también será muchas veces mayor. La falta de fiabilidad de los datos chinos puede hacer que salga ese bajo porcentaje de mortalidad poco fiable y que en realidad sea 10 veces ese valor.

El caso de Corea también es interesante. La curva parece aproximarse sólo en su primera fase aún casi exponencial. Si el modelo es correcto significa que no podrán parar la pandemia y que lo peor aún no ha llegado a Corea aunque tardará en llegar bastante. Su éxito ha sido reducir el ritmo de la pandemia del coronavirus a niveles manejables aunque duraderos.

El resto de gráficos están en una fase de pocos datos aún y hay muchos posibles ajustes de la curva, que ajustamos día a día, pero todo apunta a que Italia estaba cerca de su punto medio en la curva en el momento de creación de este post y España aún algunos días atrás. Todavía quedan varias semanas de sufrimiento.

Es de destacar también que en estos modelos al usar un porcentaje tan bajo de muertes sobre contagiados implica la existencia de un gran número de contagiados. Así por ejemplo para 0,15% de letalidad y 16300 fallecidos a 11 de abril implica la existencia de 14 millones de contagiados, en el modelo medio para España, que evidentemente o no han sido ni serán detectados pues no se hacen bastantes tests diagnósticos o simplemente ya han sanado completamente y dan negativo en las pruebas. Como referencia un trabajo del Imperial College a 30 e marzo de 2020 estimaba entre un 3,7% y un 41% de la población infectada. Las estimaciones de un alto número de contagiados también son compatibles con la noticia de que en Italia el 70% de los donantes de sangre en un pueblo de Lombardía (4-Abril) han resultado positivos y haber pasado ya el COVID19 asintomáticamente.

Con los porcentajes de mortalidad que estamos usando y se acoplan bien a los resultados reales, si las estimaciones de los modelos iniciales son correctas vemos que la mortalidad estaría en niveles cercanos a los la gripe común que está en un 0,135 % de media según el CDC, pero con unos niveles de contagio mucho mayores que están llevando a los hospitales a la saturación de camas y UCIs. Sin embargo, como hemos comentado arriba, los últimos datos del estudio de seroprevalencia en España implican una letalidad al rededor del 1,1% lo eu o lleva al modelo v2.2. Por otro lado un estudio publicado en la revista The Cell estiman que entre un 40% y un 60% de la población sería totalmente inmune con sus anticuerpos para otros coronavirus y no crearían anticuerpos específicos para el COVID-19. De ser esto cierto habría que incluirlo en un modelo que ya estoy perfilando.

Por último comentar que cuando se tratan los casos de comunidades autónomas españolas se aprecian grandes diferencias entres unas y otras, teniendo por ejemplo a Madrid como muy avanzada en la pandemia y una curva suave con poca diferencia entre los efectos de las dos fases de la cuarentena y la Comunidad Valenciana en una fase menos avanzada (pocos contagiosos y muertes) y con grandes diferencias de efecto entre una fase y otra de la cuarentena.

Página en continua construcción mientras dure la pandemia.

DISCLAIMER: el que escribe no es epidemiólogo sino solo un humilde profesor de matemáticas de secundaria en España. Cualquier decisión arriesgada que se tome en función de los datos ofrecidos será bajo su responsabilidad.

((c) Ángel Torregrosa Lillo, profesor de matemáticas en el IES San Vicente)

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *