Чтобы ответить на поставленные во введении вопросы относительно лечения и профилактики инфекции COVID-19, мы осуществили систематический компьютерный анализ всего массива публикаций имеющейся научной литературы по коронавирусам (21 000 публикаций в базе данных биомедицинских публикаций PubMed, в том числе около 7000 публикаций по COVID-19/SARS-CoV-2).
Мы провели этот анализ с использованием современных методов анализа больших данных (см. ресурс www.bigdata-mining.ru), развиваемых в рамках топологического и метрического подходов к задачам распознавания/классификации (Torshin I.Yu., Rudakov K.V., 2013-2019). В ходе систематического анализа литературы были выделены 85 информативных биомедицинских терминов, необходимых для того, чтобы отличать публикации по COVID-19/SARS-CoV-2 от публикаций в контрольной выборке текстов (статьи, найденные по запросу "(betacoronavirus OR Coronavirus OR coronaviridae) NOT COVID-19"). Была проведена рубрикация текстов исследований по молекулярно-биологическим процессам (в соответствии с международной номенклатурой GO - Gene Ontology).
Экспертный анализ полученного списка рубрик GO позволил выделить 49 наиболее информативных рубрик, которые достоверно чаще встречались в выборке публикаций по COVID-19/SARS-CoV-2 - в 3-8 раз чаще, чем в контроле (р <0,05 для каждого из 49 терминов). В результате была получена своего рода «карта» молекулярной патофизиологии COVID-19, включающая эти 49 молекулярных механизмов, ряд микронутриентов и коморбидных патологий (рис. 1).
Анализ диаграммы на рис. 1 методом метрических сгущений (Torshin I.Yu., Rudakov K V., 2017) показал, что наиболее информативные биомедицинские термины, достоверно чаще встречающиеся в публикациях по COVID-19/SARS-CoV-2, естественным образом сгруппированы в кластер I «Воспаление и формирование "цитокинового шторма"» и в кластер II «Коморбидные состояния». Эти два кластера указывают на «тактический» (кластер I) и «стратегический» (кластер II) подходы к профилактике и терапии COVID-19.