Математическая модель развития эпидемии коронавируса

Обновлено: 24.04.2024

Как и все сознательные люди, я сижу дома и пытаюсь себя всячески развлечь. Но со всех утюгов только и слышно, что про коронавирус.

Решил я узнать, когда же закончится эта канитель. Покопался в интернете и на то время ничего конкретного ни нашел.

На своей работе я уже давно ничего не программировал, а руки-то чешутся. Вот и придумал написать сайт, который соберет данные из открытых источников, красиво их отобразит их, да и еще сделает прогноз, что будет дальше.

Согласно статистике, развитие эпидемий в мире происходит по нормальному закону распределения Гаусса. Его и взял за основу.

Для начала подключился к открытым источникам и научился выкачивать данные раз в 15 минут. Отобразил их красиво с помощью Chart.js и перешел к прогнозу. Взял для работы функцию нормального распределения

y(t) = b · e -c·(t-a)2

Исходные данные ti - ежедневные отметки времени xi - число активных случаев болезни в этот день

Взял натуральный логарифм от y(t) и от данных xi

u(t) = ln(y) = ln(b)-c·t2 + 2c·a·t-c·a2

Сделаем замены: А=-с; B=2a·c; C=ln(b)-c·a2; Получаем

Чтобы найти А, В и С - использую метод наименьших квадратов, согласно которому сумма по i от 1 до n квадратов разностей

Σ(xi-y(ti))2 -> min

должна стремится к минимуму.

Назовем эту сумму Ф(А,В,С)

Продифференцируем dФ по dA, dB и dC. Производные при это должны быть равны нулю.

Получаем систему уравнений

A·Σti4+B·Σti3+C·Σti2 = Σui·ti2

A·Σti3+B·Σti2+C·Σti = Σui·ti

A·Σti2+B·Σti+C·n = Σui

Решаем эту систему по методу Крамера

Находим нужные коэффициенты a,b,c для исходной функции

c = -A a = B/2·c b = eC+c·a2

И, вуаля, готово! Программируем и рисуем красивые графики и узнаем когда это кончится!

Так как данные обновляются с появлением новых случаев, и мой прогноз обновляется тоже.

Чем больше данных, тем точнее прогноз. На данный момент, реальные данные экспертов в Италии говорят о пике эпидемии, и кривая Гаусса показывает тоже самое

не учли в графике объезд патриархом Москвы

хм.. что будет, если патриарх заразится короной?

Это никогда не закончится потому что к РНК-содержащим вирусам нет стойкого иммунитета. Коронавирус COVID-2019 просто убьёт всех кого может убить и останется жить в человеческой популяции ближайшие несколько сотен тысяч лет.

В составе сезонных ОРВИ уже есть несколько коронавирусов, но они практически не вызывают никакой летальности, но не потому что они добряки, а просто потому что они уже проредили нашу популяцию. Остались и дали потомство только те кто выжил, т.е. мы и есть продукт отбора.

"В составе сезонных ОРВИ" - С учетом легкомысленного отношения медицины в РФ (как, возможно, и в других государствах) к подобным инфекциям, так и будет. Если бы относились серьезно, то диагностировали вирус у каждого гриппующего. А они тупо не заморачиваются, пишут "ОРВИ" - и свободен.

все с точностью до наоборот, не проредили популяцию, а потеряли летальность, вследствие многочисленных мутаций при передаче по цепочке от одного инфицированного к другому

Модель изначально ошибочная. ТК в ней неверные исходные данные.

Официальные цифры по заболевшим это те люди, которые смогли таки сдать тест.

Во-первых, тест берут только при предъявлении паспорта с отметкой о въезде за последние 2 недели или после контакта документально подтвержденным носителем. Инфу тоже проверяют по ФИО.
Я знаю случаи, когда открыли в тексте людям с температурой и затрудненным дыханием в Москве.

Во-вторых, в России на каждый тест в десятки раз меньше выявленных носителей, чем в других странах. Используется только наши тесты и не импортируются другие. Можно объяснить головой чувствительностью наших тестов.

Поэтому все эти модели ничего общего с реальностью не имеют. В особенности в России Причем разница может достигать тысяч раз. Вполне может быть, что у нас уже могут быть миллионы больных.

Совершенно очевидно, что на самом деле больных, переболевших и умерших больше.

Но модель и не претендует на отображение реального количества всех этих групп, она лишь собирает все выявленные и подтверждённые кейсы из открытых источников и на их основе делает прогноз развития (а в этом и весь смысл данной конкретной модели), тебе же указали на это в самом начале статьи.

"​Прогноз развития эпидемии в России"

В Италии "карантин" вроде бы стабилизированный, прогноз совпадает.

В РФ даже карантина нет. Тот случай, когда прогнозы погоды умеют делать только на три дня. Поэтому прогноз по РФ на три дня. Хватило бы и линейной аппроксимации.

А экстремум будет обнаружен практическим путем.

Согласно теории хаоса это невозможно принципиально. Прогноз погоды не могут делать на длительные сроки:
. Зависимость от начальных условий предполагает, что мы не можем делать долгосрочные прогнозы в нестабильных динамических системах. Любая погрешность в начальных условиях не позволит нам предсказать результат на какой-либо продолжительный отрезок времени. Если, к примеру, взять модель Лоренца, в качестве входных данных для определения скорости ветра нам будет необходимо ввести значения температуры и давления в каждой точке земной атмосферы, только тогда можно будет ожидать достоверный прогноз на длительный срок. Причём, входные данные должны быть абсолютно точными, т. е. с бесконечным числом знаков после запятой. А как известно, совершенно все измерительные приборы на Земле имеют ненулевую погрешность.
undecim - Хабр

В Италии "карантин" вроде бы стабилизированный, прогноз совпадает.
В РФ даже карантина нет.
В Италии не особо строгий карантин, до китайского далеко. Транспорт ходит, в отелях работают рестораны, итд.
"не карантин" в РФ наверное даже жестче итальянского карантина.

Каждый день прогноз меняется, но за те 3 дня что существует сайт, у России менялся пик, но его дата в начале мая не менялась.

Абсолютно бесполезное моделирование, достаточно посмотреть на графика китая. Дальше даже объяснять лень, почему нормальным оно быть не может.

достаточно посмотреть на графика китая
Приведи их сюда плиз

Посмотри на артефакты на графике китая, там в один день резкий скачок, понято что гладкая кривая не строится.

Конечно я не претендую на правоту данного подхода, поэтому и описал что и как делал, чтобы знатоки математики и физики смогли доказать что так нельзя или неправильно, но пока все говорят, что так нельзя, а почему нельзя так и не понял.

Хотел лайк поставить о бесполезном моделирования, пока не дочитал про графики Китая. (( инфе из коммунистического Китая я бы доверял в последнюю очередь

Это полезное моделирование, достаточно посмотреть на модель, представленную правительством США.

Да сейчас данные настолько фрагментарные и неполные, что любые выкладки и попытки анализа будут гаданием на кофейной гуще

Интересно,а почему у Вас слайсы с данными предопределены заранее (или это вообще массив, тогда почему массив?),получается весь график по факту сам по себе до бесконечности "в режиме онлайн" строиться не будет?

Там несколько линий данных, то что с запятыми и пустотой - это реальные данные, прогноз отдельная линия. В режиме онлайн грузятся данные по странам, данные за сегодня не используются для прогноза, так как они наполняются медленно и ночью равны вчерашним, что сбивает расчет.

Лучше скажите, почему при условии, что весь мир находится в изоляции, а среднее время проявления вируса пять дней (а не две недели - это срок жизни вируса в человеке), то откуда такой рост зараженных? 4 дня назад было +60К. Сейчас +100К.

Возможно все больше и больше проходит тестирований ежедневно

Мне кажется по итогу этой эпопет нас ждут очень интересные результаты.

Я один такой тупой, или всем пофиг. Смотрю на выходы зараженных - на 4 выздоровевших 1 умер (на планете) , т.е.. 20% смертность. В Италии 50% на 50% . Какой нах оптимизм? Че автор кривую прогнозируемых смертей не нарисовал? Поистине тупость всепланетная.

Нет, такой тупой ты не один, вас много, поздравляю

Профессор из Израиля изобрел способ победить коронавирус за 2 месяца
Так утверждает профессор Амнон Шаашуа, генеральный директор компании Mobileye и один из ведущих деятелей израильского хай-тека.

Шаашуа вместе с двумя коллегами, разработал математическую модель, с помощью которой можно, по его словам, изолировать группы риска и позволить большинству населения страны постепенно выйти из режима ЧП и вернуться на рабочие места.

Бля, изобретение )))))) Это же просто элементарно и очевидно как дважды два - изолировать только группы риска, а всех остальных не трогать и не заебывать карантинами.

А предполагается, что эта закономерность соблюдается и на более мелких областях? Мб тогда уж для России сделать отдельную выборку по субъектам федерации и миллионникам, например?

Строить какие-либо модели в условиях полной неопределенности не вполне корректно, но без моделей трудно определиться с природой процесса. Как врач я могу отметить- сегодня нет ни представлений о скорости и качестве иммунитета, ни вакцин, ни эффективных медикаментов. Учитывая особенности короновируса, можно полагать, что должно переболеть до 70-90% населения. Прививку создать технически невозможно в ближайшие 2 года. Основная задача заключается- в разгрузке системы здравоохранения, сохранения экономики, что позволит лечить тяжелых больных. Иными словами растянуть сроки пандемии, что даст шансы при ослаблении вируса выжить пожилым больным. Летальность, к сожалению составит не менее 1% (даже с отсрочкой на 1-2 года). Поэтому нужно спокойно выдерживать разумную самоизоляцию как, например в ФРГ. Желаю всем здоровья. Д.м.н., проф. А.Цикулин. ФРГ

Сегодня в Италии порядка 100т. активных случаев. С графиком явное не совпадение.

А вот американский график очень близок. На сегодня порядка 2т. смертей за сутки.

Обобщая все вопросы к прогнозу, понял что основной вопрос — это почему Гаусс?

У Китая склон спада более пологий чем склон подъема, что не похоже на симметричного Гаусса, но похоже на логнормальное распределение.

У некоторых стран, например у России, не считается долгосрочный прогноз - данные такие, что Логнорма очень хорошо проходит по точкам, но не чувствует пика и рисует его очень далеко и высоко.

Для таких стран отображаю прогноз на 20 дней вперед. Думаю, по мере поступления новых данных, это пройдет.

А вообще, если по всем странам посмотреть, то Логнорма везде лучше, чем Гаусс.

Как думаете для обсуждения нового прогноза, сделать отдельный пост, где подробно расскажу о новом прогнозе?

Эта публикация о наипростейшей математической модели развития эпидемии, имеющей всего два параметра, которая адресована всем тем, кто хочет узнать, что будет окружать нас и наших соседей завтра, через неделю, через месяц или два. Заранее благодарен тем, кто, насладившись моделью, обнажит ее пороки и поможет сделать ее лучше.

Вступление. Несколько слов о полуголых числах

Оценивая развитие эпидемии следует помнить, что ее развитие определяется количеством носителей вируса, а проявляется через число подтвержденных диагнозов. Эти величины нетождественные. Мы можем только предполагать, что число носителей вируса в инфицированном обществе прямо пропорционально числу подтвержденных диагнозов. Коэффициенты пропорциональности могут различаться как в автономных областях одной страны, так и в разных странах.

Источники официальной и неофициальной информации о легочном заболевании, которое ВОЗ назвал COVID-19 [5], постоянно сообщают подтвержденные случаи, когда люди были положительно протестированы на Sars-CoV-2. Но эти цифры ничего не говорят о том, сколько людей в разных странах на самом деле несут или несли в себе вирус, а также о том, сколько болеет или до настоящего времени заболело COVID-19, вызванной вирусом.

Из этого можно сделать вывод, что число носителей вируса может быть оценено в лучшем случае грубо. По этой-же причине не имеет смыла сравнивать абсолютные числа подтвержденных диагнозов в разных странах и строить умозаключения по результатам деления числа диагнозов на число граждан.

Пожалуйста, всегда имейте в виду эти неопределенности при интерпретации полуголых чисел.

Принципы развития эпидемии

Согласно фундаментальному Курсу дифференциального и интегрального исчисления Г.М. Фихтенгольца, пытаясь описать развитие пандемии COVID-19, мы описываем обыкновенную варианту – или функцию времени, отражающую последовательность ежедневных значений характеристики развития эпидемии (или пандемии – кому как нравится). Мы получаем оценки значения этой функции в виде случайной выборки – тех чисел, которые ежедневно приносят отчеты о числе новых подтвержденных диагнозов, числе умерших или выздоровевших. Наша задача – найти закон изменения функции (или варианты по Фихтенгольцу) со временем (день за днем) по результатам случайной выборки. Цель такого поиска – найти надежную основу для прогноза развития эпидемии. А область применения результатов – принятие обоснованного решения, например, о том, когда уже можно будет поехать с подругой в Плес на Волгу или о том, когда-же наконец властям можно будет снять карантинные мероприятия в стране и можно будет приглашать иностранных коллег на симпозиум. К сожалению, от того как развивается эпидемия, сейчас так много зависит в нашей жизни.

Интересующая нас функция – зависимость суммарного числа носителей Sars-CoV-2, или пропорциональное ему число подтвержденных диагнозов COVID-19 от времени. Это неубывающая функция: сегодняшнее значение функции должно быть больше или равно тому, которое было вчера. Такая функция является отражением самого общего закона развития эпидемии [5, 6]. В его основе лежат три принципа.

Принцип пропорциональности. Суточный прирост числа носителей вируса в инфицированном обществе пропорционален суммарному числу носителей вируса, возникших за все предыдущее время развития эпидемии.

Принцип независимости. Относительный суточный прирост числа носителей вируса не зависит от суммарного числа носителей вируса, возникших за все предыдущее время развития эпидемии.

Математическое выражение закона развития эпидемии, отвечающего этим принципам, элементарно:

N(n+1) = N(n) + f(n)×N(n) = N(n)[1+ f(n)],

  • Если f(n) растет со временем, то эпидемия прогрессирует, и суммарное число бывших и настоящих носителей вируса растет все быстрее и быстрее, как росли бы деньги на банковском вкладе, если бы банк изо дня в день повышал процентную ставку;
  • Если f(n) не изменяется со временем, то эпидемия развивается, но медленно, как растут деньги, положенные на счет с неизменной процентной ставкой;
  • Если f(n) уменьшается со временем, то эпидемия развивается, но все медленнее и медленнее, как растут деньги, положенные на счет в банке, который постоянно снижает процентную ставку;
  • Если f(n) равна нулю, то эпидемия закончилась. Все кончено и суммарное число носителей вируса больше не растет.

N(n+1) = N(n)[1+ f(n)],
N(n+2) = N(n)[1+ f(n)] × [1+ f(n+1)],
N(n+3) = N(n)[1+ f(n)] × [1+ f(n+1)] × [1+ f(n+2)],

В условиях управления развитием эпидемии, вид функции воспроизводства эпидемии определяется действием нескольких факторов 4:

  1. Случайными изменениями вируса вследствие мутаций, сопровождающих воспроизводство вируса в организме носителя вируса;
  2. Действиями медиков, которые с помощью тестирования определяют носителей вируса в инфицированном обществе и не допускают дальнейшую передачу вируса, ограничивая контакт установленного носителя с окружающими;
  3. Действиями властей, которые с помощью карантинных мер ограничивают возможность контакта неустановленного носителя с окружающими.

Развитие любого инфекционного заболевания характеризуется скрытым (латентным) периодом его развития от передачи вируса его носителем здоровому человеку до проявления симптомов заболевания и последующего подтверждения диагноза у нового носителя вируса. Поэтому изменение мер властей по управлению эпидемией или саботаж таких мер членами инфицированного общества не проявится в изменении числа носителей вируса мгновенно. Эти действия и вызванные ими видимые изменения, например, числа диагнозов или смертей, будет разделять промежуток времени, примерно равный латентному периоду развития заболевания. Отсюда вытекает третий принцип развития управляемой эпидемии.

Принцип последействия. Относительный суточный прирост числа носителей вируса с опозданием отражает меры по управлению эпидемией или их саботаж.

Наглядным примером действие этого принципа является дистанционное управление марсоходом. Оператор на Земле нажимает педаль тормоза, а аппарат на Марсе останавливается только через 3 минуты из-за конечности скорости распространения радиоволн.

Типическая эпидемия

Типической эпидемией является эпидемия, развитие которой подчиняется Принципу пропорциональности, Принципу независимости и Принципу последействия, а функция воспроизводства имеет вид убывающей экспоненциальной функции времени с постоянными параметрами.

В период 10-40 суток параметры экспоненциальной функции f(n) равнялись: А = 0.14604 1/сут. и В = 1.234. При этом 13 февраля случился кризис системы подтверждения диагнозов и их число за один день увеличилось почти на 17 тыс. [1,2]. При этом такой вброс новых диагнозов не привел к изменению параметров функция воспроизводства. После 40-х суток, на третьем, заключительном этапе развития эпидемии А = 0.324 1/сут. и В = 3.273.

Изменение параметров функции воспроизводства f(n) явилось следствием действий властей, направленных на усиление карантинных мероприятий, затрудняющих воспроизводство и передачу вируса. При этом, согласно Принципу последействия, эти действия и последующие изменения функции воспроизводства не происходили одномоментно. Их разделяет временной интервал, примерно равный 5-15 дням.

Примерно 10 марта величина относительного суточного прироста числа подтвержденных диагнозов опустилась ниже уровня 0.0001 1/сут. Китайские власти начали снимать карантинные ограничения и 15 марта официально заявили, что эпидемия COVID-19 в провинции Хубэй закончилась.

image

Рис. 1. Развитие эпидемии COVID-19 в провинции Хубэй (Китай)

Еще один пример типического развития эпидемии демонстрирует Швейцария. В Швейцарии (см. рис 2) зависимость функции воспроизводства f(n) от времени остается неизменной с 16 марта, на десятый день после того, как число подтвержденных диагнозов превысило критический уровень, равный 100 [1,2]. Развитие эпидемии COVID-19 – типическое. Параметры функции воспроизводства эпидемии: А = 0.0910 и В = 0.6443.

image

Рис. 2. Развитие эпидемии COVID-19 в Швейцарии

Устойчивое падение скорости воспроизводства эпидемии в Швейцарии отражает усилия властей и жителей в борьбе с эпидемией. Жесткие меры вмешательства китайских властей при полном подчинении этим мерам со стороны жителей позволили обеспечить быстрое окончание эпидемии. Либеральные карантинные меры властей в совокупности с полной поддержкой этих мер жителями позволили властям и жителям Швейцарии остановить эпидемию, но только к 80-му дню ее развития добиться результатов, которых провинция Хубэй достигла на 30 дней раньше, к 50-му дню.

Атипическая эпидемия

Есть страны, в которых и действия властей были малоэффективны, а их саботаж со стороны тех, кого власти должны защитить, и вовсе свел эти меры на нет. Такие страны являют примеры атипического развития эпидемии COVID-19.

image


Рис. 3. Развитие эпидемии COVID-19 в Иране

На рис. 3 представлена картина развития эпидемии COVID-19 в Иране. Сильная светская иранская власть за первый месяц развития эпидемии добилась больших успехов в управлении эпидемией. Но затем произошли два события, которые привели к катастрофическим последствиям. Следствие первого события – всплеск f(n) 24-31 марта. Если-бы всплеска не было, в Иране число подтвержденных на сегодня (25 мая) диагнозов было-бы около 30 тыс. вместо 135 тыс. Что было толчком, вызвавшим всплеск воспроизводства эпидемии? Такой толчок – это акт саботажа — грубое нарушение карантинных мероприятий, например, народное гуляние посреди периода самоизоляции. Как было показано ранее, время между актом саботажа и всплеском числа обращений за медицинской помощью должно составлять примерно 5 — 15 дней. Какие события массового нарушения карантинных мероприятий, связанные со скоплением людей, произошли в Иране за 5 — 15 дней до 24-31 марта? В календаре светских и религиозных праздников в Иране таких событий несколько: 8 марта День отца в мусульманских странах и День рождения имама Али; 10 марта — День традиционной курдской одежды; 21 марта – Навруз и 22 марта – Исрав-аль-Мирадж. День отца и Навруз – достойные поводы собраться, пообщаться (поцелуи – непременный атрибут радушной встречи на Востоке) и поспособствовать воспроизводству носителей вируса. Вслед за этими событиями светские власти Ирана власти снова установили жесткий контроль над развитием эпидемии, но 1 мая стало понятно, что контроль над эпидемией стал не эффективен. 18 апреля в Иране отметили День армии, которому 11 апреля предшествовало снятие многих карантинных ограничений [9]. Результат – частичная потеря контроля над эпидемией и безудержный рост числа подтвержденных диагнозов в мае.
Другим примером потери контроля над развитием эпидемии является ситуация в столице Австрии – прекрасной Вене. На рис. 4 представлена картина развития эпидемии COVID-19 в Вене.

image

Рис. 4. Развитие эпидемии COVID-19 в Вене

Как рассказывают венские жители, карантинные меры в городе свелись к прекращению работы офисов и предприятий, закрытию городских парков, музеев и всего, где люди могли вольно или невольно общаться, включая продовольственные магазины. Те, что продолжили работу были переполнены. На улицах полиция не допускала появления только пожилых жителей города. Все остальные должны были заботиться о своей безопасности сами. И люди отправились гулять в парки и леса, не имеющие ворот и заборов, которых много в Вене и окрестностях. Как результат – очень большая вариация f(n), указывающая не слабое управление эпидемией. После 14 апреля (Католическая Пасха) в Вене вообще началось что-то похожее на события в Иране после 1 мая. Функция воспроизводства эпидемии практически перестала изменяться. Ее выборка – метания вокруг 0.012 1/сут. Как результат – непрекращающийся рост числа подтвержденных диагнозов в течение последних 50 дней, аналогичный иранскому. К тому-же случился кризис системы медицинской помощи: после 4 апреля число больных встало на отметке 1500 человек, по-видимому, это максимум для Вены, а за два дня 16-17 апреля больных в Вене стало меньше на 1000 человек. Эту тысячу признали выздоровевшими. Как результат – в течение последних 40 дней число больных в Вене практически не меняется и остается на уровне 450-500 человек. Людей вылечивают, но им на смену сразу приходят новые и ничего не меняется. Ничего подобного в остальных 8 федеральных австрийских землях не происходило [6]. Если-бы власти удержали контроль над эпидемией в конце апреля – начале мая, ситуация могла развиваться как показывает красный пунктир.

В истории развития эпидемии COVID-19 в Москве, как и в России в целом, тоже случился саботаж. На рис. 5. Показано развитие эпидемии COVID-19 в Москве.

image

Рис. 5. Развитие эпидемии COVID-19 в Москве

Толчком, приведшим к всплеску функции воспроизводства эпидемии 30 апреля – 3 мая скорее всего были Пасхальные мероприятия в совокупности с заторами на входе станций Московского Метро в понедельник 15 апреля. Второе событие стало следствием введенного правительством Москвы ограничительного режима использования общественного транспорта. Власти Москвы вводили ограничения на пользование общественным транспортом в два этапа. С 25 марта был отменен льготный проезд в транспорте для пожилых и студентов. 11 апреля было принято решение о введении пропускного режима на транспорте с 15 апреля, сразу после Пасхальных мероприятий. Скопление людей в церквях и на входе в метро стало толчком (саботажем?), приведшем к всплеску функции воспроизводства эпидемии в начале мая. То, что такой-же всплеск произошел во всей России, версия о причастности к нему именно Пасхальных мероприятий наиболее вероятная.

Параметры модели развития типической эпидемии

Так как развитие типической эпидемии предсказуемо, считаю необходимым представить в распоряжение читателей параметры функции воспроизводства эпидемии в ряде стран и городов. Они приведены в Таблице.

Имеющийся опыт использования модели развития типической эпидемии COVID-19 дает прогноз числа подтвержденных диагнозов с неопределенностью около 10-15%. Согласно существующей практике, при уменьшении f(n) ниже 0.001 1/сут власти могут принять решение об ослаблении или полном снятии карантинных мероприятий. В этой области условия типичности эпидемии не будут соблюдаться и прогнозные оценки числа подтвержденных диагнозов будут занижены. Это следует учитывать при оценке прогноза для стран, в которых эпидемия близка к окончанию.

Таблица. Параметры функции воспроизводства числа подтвержденных диагнозов в ходе развития типической эпидемии COVID-19.

image

Заключение

В середине апреля Москва и Россия наступили на первые грабли, на которые Иран наступил месяцем раньше – в середине марта. На вторые иранские грабли наступила Вена. Если в отличие от Вены мы не наступим на вторые иранские грабли, то, как показывают оценки на рис. 5, проведение Парада Победы, назначенное Президентом на 24 июня может быть безопасным.

Усаживайтесь поудобнее, нас ждет зубодробительный матан для тех, кто знает, что такое дифференциальные уравнения (для остальных красивые картинки прилагаются).



На рисунке выше приведено общее число подтвержденных случаев COVID-19 в логарифмическом масштабе для России и трех европейских стран, входящих в топ-5 по числу зараженных. Объяснение далее в тексте.

Минутка заботы от НЛО

В мире официально объявлена пандемия COVID-19 — потенциально тяжёлой острой респираторной инфекции, вызываемой коронавирусом SARS-CoV-2 (2019-nCoV). На Хабре много информации по этой теме — всегда помните о том, что она может быть как достоверной/полезной, так и наоборот.

Мы призываем вас критично относиться к любой публикуемой информации

Мойте руки, берегите близких, по возможности оставайтесь дома и работайте удалённо.

Модель SEIRD

Модель эпидемии SEIRD относится к классу т.н. компартментальных моделей, суть которых состоит в том, чтобы разделить популяцию на несколько групп (англ. compartments), в нашем случае: (англ. susceptible) — восприимчивые, (англ. exposed) — те, у кого болезнь находится в инкубационном периоде, (англ. infectious) — больные, (англ. recovered) — выздоровевшие, (англ. dead) — умершие. Затем, численность каждой из групп сопоставляется с переменной в системе дифференциальных уравнений, решая которую, можно спрогнозировать динамику развития эпидемии. Модификаций модели SEIRD достаточно много, например, SEIR — упрощенная модель, не учитывающая отдельно случаи выздоровления и смерти. Для ознакомления с другими моделями могу порекомендовать неплохую статью на эту тему.

Немного теории


Впервые модель эпидемии в виде системы из трех дифференциальных уравнений для переменных появилась в работе У. Кермака и А. Мак-Кендрика 1927 года.
Эти дифференциальные уравнения имеют вид:


где, помимо знакомых нам переменных фигурируют следующие константы: — общий размер популяции, — скорость передачи инфекции, — скорость выздоровления.

Смысл уравнения Кермака и Мак-Кендрика следующий: число восприимчивых убывает пропорционально их числу, помноженному на среднюю долю инфицированных в популяции , число инфицированных прирастает теми же темпами с поправкой на то, что некоторое их число выздоравливает, и число выздоровевших прирастает за счет убывания числа инфицированных. Стоит отметить, что модель SIR содержит нелинейность , из-за чего аналитическое решение системы уравнений становится в общем случае невозможным, но, благо, методы численного дифференцирования легко справляются с этой задачей.

Добавив сюда еще одну переменную (число людей с болезнью в инкубационном периоде), получим SEIR-модель:


где появляется еще одна константа — скорость перехода болезни из инкубационной стадии в открытую. Рисунок из взят из статьи.



На первый взгляд, полученная модель обещает быть вполне правдоподобной.

Численный эксперимент с моделью SEIR

Для моделирования попробуем взять следующие параметры, ориентируясь на открытые данные. Предполагая, что болезнь в среднем длится 14 дней (по крайней мере, сколько длится легкая форма, на которую приходится до 80% случаев), найдем значение . Примем . Величину заимствуем из работы Pengpeng et al. C учетом средней длительности инкубационного периода в 3 дня, возьмем . Население России примем равным человек.

В качестве начальных условий используем данные по России на 2 апреля, когда введенные в конце марта меры по ограничению распространения инфекции должны были возыметь свое действие, а именно:


Оценку мы взяли относительно произвольно, да это и неважно, поскольку, как вы понимаете, что-то пойдет не так.

В результате моделирования методом Эйлера с шагом в 1 день со 2-го по 24 апреля включительно, получим графики, приведенные ниже: слева в линейном масштабе, справа в логарифмическом.


Круглыми маркерами отмечены реальные данные по общему числу случаев в России, квадратными — по числу больных. На первый взгляд, результаты выглядят неплохо, кроме одного: с параметрами модели мы явно не угадали. И тут нам на помощь приходят методы оптимизации.

Оптимизируй это

Методы оптимизации, если читатель с ними не знаком, — это алгоритмы, позволяющие отыскать минимум некоторой целевой функции. В нашем случае перед нами — задача нелинейной регрессии: как подобрать вектор параметров дифференциального уравнения так, чтобы набор точек решения дифференциального уравнения был максимально близок набору точек наблюдения .

Воспользуемся среднеквадратичным отклонением как мерой погрешности модели. Целевая функция примет вид


где — число точек, — общее число случаев заражения, которое дает модель, — реальное общее число случаев, — число больных в текущий момент, которое дает модель, — реальное общее текущих активных случаев.

Воспользовавшись Optimization Toolbox в MATLAB, подгоним параметры модели под данные наблюдения. В результате получим решение, приведенное на рисунке ниже.

image



Здесь я сравниваю три европейские страны, находящиеся в топ-5 по количеству заболевших, и Россию. Видно, что по темпам развития эпидемии мы отстаем примерно на месяц, и что вот уже как месяц рост общего числа случаев во всех трех странах практически линейный (и даже медленнее линейного), в отличие от результатов, полученных в SEIR модели. Отсюда возникают три вопроса:

  1. Почему рост эпидемии замедляется до линейного?
  2. Как изменить классическую модель SEIR, чтобы она снова была релевантной?
  3. Почему, если рост эпидемии линейный, мы все равно не можем ничего уверенно предсказать на месяц или год вперед?

Костыли и велосипеды: модифицируем модель SEIR

Попробуем ответить на вопрос, почему рост эпидемии замедляется до линейного. При том количестве зараженных, какое мы имеем сейчас, значительную роль начинает играть эффект масштаба, связанный с ограниченной скоростью коммуникаций между людьми.

Если говорить более точно, то вспомним: число заболевших в модели SEIR прямо пропорционально среднему числу заболевших в популяции . Это правило хорошо работает в небольших популяциях, где каждый может общаться с каждым, а заболевшие распределены равномерно. В реальности, особенно в масштабах десятков и сотен тысяч человек, если взять двух случайных заболевших людей, то окажется, что они не только никогда друг с другом не общались и не видели друг друга, они даже не ездили в одном и том же вагоне метро. Да и вообще живут в разных городах. Все, что их объединяет — цепочка социальных связей, приведшая к тому, что им передался вирус.

В качестве примера я построил модель эпидемии в виде клеточного автомата, где каждая клетка взаимодействует только с 4 соседними. Это эквивалентно тому, что у каждого индивида популяции 4 социальных контакта — это очень маленькое число для человеческой популяции, но тем быстрее проявится эффект ограничения социальных связей. На каждой итерации с вероятностью 0,1 каждый из 4-х соседей зараженной клетки может быть заражен. Болезнь длится в среднем 14 дней. Результаты моделирования для пула из 200x200 клеток представлены на рисунке ниже, где — номер итерации.


Синий цвет обозначает восприимчивых, желтый — заболевших, зеленый — выздоровевших. Самое интересное — как выглядят графики численности заболевших. А выглядят они примерно так, как и планировалось: после недолгой фазы субэкспоненциального роста, прямо как в модели SEIR, наблюдается затяжная фаза линейного роста — прямо как в реальности.


У меня не было цели получить картинку, похожую на реальность количественно. Если хочется большего правдоподобия — могу порекомендовать проект Сергея Потехина, о котором была недавно публикация на Хабре. Для дотошных читателей ниже приведено более строгое доказательство линейности роста.

Возьмем геометрическую интерпретацию: пусть граф социальных связей представлен в виде -мерной решетки. В модели в виде клеточного автомата решетка двумерная. В реальности, при среднем числе ежедневных социальных контактов в 20 (оценка из вышеупомянутой публикации) размерность может быть грубо оценена как . Каждый носитель инфекции порождает растущий вокруг него -мерной гиперкуб из вторично зараженных. Ребро куба имеет длину , и, если контакт с зараженным приводит к заболеванию с вероятностью , то каждый день каждое ребро в среднем удлиняется на . Таким образом, получаем модель роста, выражающуюся рекуррентным соотношением

Представим как функцию времени: . Продифференцировав предыдущее соотношение, получим:

Отсюда видно, что при больших значениях производные равны , следовательно, рост линейный.

Ниже представлено развитие сценария при вероятности заразиться 4% и 16-ти социальных связях одного индивида.



Обратившись к мировой статистике по эпидемии, мы увидим то же самое: вот уже месяц как рост линейный, несмотря на то, что классические модели обещали нам продолжение экспоненциального взлета числа заболевших.


  1. Зная наклон прямой роста числа случаев COVID-19, вычислите среднее количество offline социальных связей на планете Земля.
  2. Как полученное в п.1 число соотносится с правилом шести рукопожатий?
  3. Используя результаты пп.1 и 2, опубликуйте статью в математическом журнале.


Теперь о модификации модели SEIR. Самое простое, что мы можем сделать — домножить нелинейный компонент на некоторую функцию, зависящую от числа заболевших. При малом числе заболевших эта функция должна быть близка к 1, при большом — должна асимптотически стремится к нулю. Простейшим подходящим кандидатом является


Подбором параметров и можно компенсировать экспоненциальный рост в оригинальной модели.

Добавим в модель, для большей информативности, и компоненту — число смертей. Получим модифицированный вариант SEIRD-модели:

Результаты моделирования показаны на рисунке ниже.


Среднеквадратичная погрешность по сравнению с оригинальной моделью почти не изменилась. Величины параметров уже реалистичны. Для удобства я обозначил начальное число зараженных в активной фазе как .

Модель очень хорошо интерполирует и производные — величины ежедневного прироста числа заболевших и количества смертей.


Попробуем сделать прогноз. Возьмем горизонт прогнозирования 2 месяца и продолжим решения модели с найденными оптимизационной программой параметрами.


На первый взгляд, неплохо, но такой прогноз любимой родине не пожелаешь: число новых случаев будет продолжать снижаться, но общее число продолжит расти. Остановить эпидемию в этом случае можно только с помощью вакцины, либо подождав, пока переболеет почти все население. Число новых смертей устанавливается равным примерно 200 в день. Это наглядная иллюстрация того, что будет, если не усиливать меры по борьбе с эпидемией. Неужели нас ожидает именно это? И ради этого не очень светлого будущего многие из нас прилежно сидят дома, закупившись гречкой и туалетной бумагой?

Ниже я рассмотрю два сценария, и глядя на туманную даль грядущих месяцев из 28 апреля 2020 года, не могу точно сказать, по какому из них будут развиваться события дальше. Сейчас, в момент перелома кривой новых случаев, мы находимся в точке, откуда что-либо предсказать вдвойне проблематично.

Сценарий США

Модифицированная модель SEIRD, обученная на первых 33 точках, начиная со 2 марта, плюс-минус реалистично предсказывает течение эпидемии в апреле.


Как видим, рост в апреле практически идеально линейный. Модель немного завышает смертность по апрелю, но общая картина оказывается верной.


На этой картинке показаны данные по ежедневному приросту новых случаев и смертей в США. Очень похоже на то, что предсказывала модель для России.

Сценарий Германии

Дисциплинированные немцы сумели переломить ход кривой в свою пользу, и ее рост происходит медленнее линейного. Более того, чтобы сделать модель релевантной, мне пришлось вручную добавить 6 апреля увеличение коэффициента выздоровления в 1,7 раз, иначе такое резкое падение числа случаев в терминах модели SEIRD не объяснить.


Модель обучалась на первых 27 точках, начиная с 10 марта. Также я изменил и нелинейную функцию. Для Германии лучше подошла экспонента, зависящая от времени:


Такой вид функции свидетельствует о кумулятивном нарастании числа прерванных социальных связей и, соответственно, путей распространения инфекции. Вот вам и наглядная иллюстрация пользы самоизоляции.


Выше показаны величины ежедневного прироста новых случаев и смертей. Как и в случае США, реальные данные содержат ясно выраженные колебания с периодом в 7 дней. Это значит, что в выходные дни число контактов увеличивается, а следовательно, растет и число зараженных. [UPD: или напротив, уменьшается, о чем может косвенно свидетельствовать индекс самоизоляции Яндекса. ]

Заключение

Делать прогнозы — как краткосрочные, так и долгосрочные — не просто дань любопытству. В случае эпидемии нужно знать, сколько койкомест следует подготовить, сколько аппаратов ИВЛ произвести, на сколько месяцев сделать запасы средств индивидуальной защиты для медиков. Должностные лица должны понимать, достаточно ли принятых мер, или следует ввести новые запреты и ограничения. В идеале, модель должна настолько хорошо отражать реальность, чтобы по ней можно было увидеть силу действия каждой вновь принятой меры, и тогда можно было бы усиливать полезные меры и отменять решения, оказавшиеся бесполезными.

Хоть и с некоторыми оговорками, но всех, кто пока еще не приобрел иммунитет от COVID-19, действительно можно описать буквой , все многообразие заболевших людей — буквой , и так далее. Более того, с помощью модели SEIRD можно даже кое-что объяснить. Но предсказать что-то в отдаленном будущем она может крайне приблизительно.

Пока все, что нам остается — меньше посещать общественные места, пользоваться правильными респираторами, мыть руки, не забывать протирать спиртом смартфон после того, как достали его на улице, и соблюдать другие простые рекомендации.

Но все же, есть ли возможность делать более точные предсказания? Да, конечно. Но об этом как-нибудь в другой раз.

Если у вас есть желание поиграть с исходным кодом и самим предложить вариант развития событий, то вот ссылка на гитхаб.

Эпидемии издавна угрожали человечеству, и только в ХХ веке были разработаны эффективные средства борьбы с инфекциями. К числу этих средств принадлежат и системы дифференциальных уравнений — математика помогает моделировать распространение эпидемий и помогает понять, как следует с ними бороться. Это наш третий материал о самых интересных дифференциальных уравнениях и о том, где и как они применяются (предыдущие материалы можно прочитать здесь и здесь). Если вы читаете нас с телефона, переключайте страницу на десктопную версию, так вы сможете увидеть интерактивный график целиком.

В XXI веке мир уже успел столкнуться с эпидемией птичьего гриппа в Юго-Восточной Азии (в 2013 году) и вспышкой заболеваний лихорадкой Эбола в Африке (2015). Но в истории человечества бывали и куда более масштабные эпидемии.

В 551-580 годах нашей эры в Восточной Римской империи разразилась первая задокументированная пандемия чумы, получившей название Юстиниановой, в результате которой погибло около 100 миллионов человек (по другим данным, жертв могло быть значительно меньше). Спустя еще 800 лет в Евразию и Северную Африку пришла Черная смерть — пандемия чумы, сразившая от трети до половины тогдашнего населения этих регионов.

В результате Первой мировой войны, вызвавшей перемещение большого количества людей, в 1918 году распространился испанский грипп, охвативший более 500 миллионов человек и погубивший каждого десятого заболевшего. Эта пандемия стала самой масштабной за всю историю человеческой цивилизации, коснувшись до 30 процентов населения Земли.

В медицинской классификации эпидемией называют прогрессирующее распространение инфекционного заболевания на уровне выше среднего на данной территории. В случае распространения эпидемии на большие территории или территории многих стран говорят о пандемии.

Для эпидемии среди животных применяется термин эпизоотия, а среди растений — эпифития. Этим явлениям ученые также уделяют большое внимание, поскольку они, в свою очередь, помогают понять механизм распространения инфекций.

Изучение механизмов развития и распространения эпидемий является важным способом борьбы с заболеваниями наряду с поиском новых лекарств, вакцинацией и профилактическими мерами. На помощь медикам пришли математики — для этого им пришлось объединить дифференциальные уравнения и теорию вероятности.

Первую попытку использовать математический аппарат для исследования механизмов распространения заболеваний предпринял Даниил Бернулли, ранее открывший первые законы гидродинамики. Следующий шаг сделал Уильям Фарр, применивший в 1840 году нормальное распределение к анализу смертности от оспы.

В рамках этой модели с помощью систем дифференциальных уравнений (при условии непрерывности времени и большой популяции) или разностных уравнений (при дискретном времени и ограниченной популяции) описывается динамика распространения заболевания.

Модель SIR

SIR–модель получила заслуженную популярность в силу простоты построения и использования. Ее применение позволяет точно моделировать эпидемии гриппа и других заболеваний в больших городах, вводить новые параметры и анализировать разные сценарии.

Читайте также: