5.1. Генетика
5.1.1. Развитие и совершенствование алгоритмов клинической интерпретации геномных данных
Высокопроизводительное секвенирование ДНК (high-throughput sequencing, HTS) произвело революцию в диагностике наследственных заболеваний, сделав возможным получение больших объемов геномных данных за короткий промежуток времени. В последние 10 лет доступность и распространенность HTS в клинической практике неуклонно повышается [1], причем наиболее существенно растет доля полногеномного секвенирования (whole genome sequencing, WGS), поскольку этот метод сочетает относительную коммерческую доступность (в пределах 600 долл. США за 1 геном на 2023 г. [2]) с широкими техническими возможностями, позволяющими детектировать практически все виды точковых и протяженных генетических изменений не только в кодирующей, но и в регуляторной части генома [3-5]. Быстрый рост объема и разнообразия накопленных геномных данных обуславливает необходимость улучшения существующих и разработки новых алгоритмов их клинического анализа.
Потребность в стандартизации и выработке единых алгоритмов анализа геномных данных возникла одновременно с широким распространением HTS в медицине. В 2015 г. Коллегия медицинских генетиков США (ACMG) представила рекомендации по клинической интерпретации данных, полученных методами HTS [6], в которых было предложено разделение генетических вариантов по степени влияния на фенотип пациента на пять классов: «доброкачественный», «вероятно доброкачественный», «вариант неопределенного значения (variant of uncertain significance, VUS)», «вероятно патогенный», «патогенный». Данный подход по сей день остается «золотым стандартом» и основой повседневной практики биоинформатиков-интерпретаторов, генетиков и клиницистов. Тем не менее, достаточно быстро стало очевидно, что «классические» рекомендации 2015 г. во многих случаях требуют уточнений и дополнений, а спектр их эффективного применения фактически ограничен менделирующими заболеваниями с полной пенетрантностью. С этим связано появление ряда междисциплинарных инициатив по разработке улучшений и дополнений к стандартным алгоритмам интерпретации данных HTS. В первую очередь в этой связи следует отметить клинический консорциум ClinGen, созданный национальным институтом здоровья США специально для выработки стандартов интерпретации геномных данных и аккумуляции международного опыта в этой области [7]. В рамках проекта ClinGen выпущен ряд руководств, разъясняющих и конкретизирующих применение отдельных критериев классификации, используемых в «классических» рекомендациях [8]; к примеру, были подробно разъяснены аспекты классификации такой важной и разнородной группы генетических изменений, как варианты с потерей функции гена [9], и порядок учета интерпретатором данных функциональных исследований генов [10]. Кроме того, ClinGen разработаны и внедрены специализированные руководства по интерпретации генетических вариантов для ряда отдельных генов и заболеваний [11-13], учитывающие особенности патологических механизмов и фенотипического разнообразия в каждом конкретном случае. К настоящему моменту реестр спецификаций ClinGen для интерпретации геномных данных содержит уже около 100 пунктов [14] и непрерывно пополняется.
Недавно коллективом ученых под эгидой Лейденского университета была предложена еще одна система классификации генетических вариантов, основанная на «классических» рекомендациях ACMG – «пошаговая система ABC» [15]. Данная система, как и многие разработки консорциума ClinGen, преследует своей целью усовершенствование алгоритма интерпретации, заложенного в «классическом» руководстве, и уменьшение числа вариантов, попадающих по итогам классификации в «серую» зону VUS, которая ограничивает применимость результатов ДНК-диагностики в клинической практике. Система ABC предполагает, что влияние варианта на функцию гена (шаг А) и каузативная (причинная) связь этого гена и варианта с фенотипом (шаг В) оцениваются раздельно и последовательно друг за другом, после чего к результатам оценки прибавляются клинические особенности конкретного фенотипа, пациента и др. (шаг С). Авторы заявляют, что система ABC пригодна для корректной оценки всех типов генетических вариантов, которые подпадают под ограничения исходного алгоритма ACMG, в том числе гипоморфных, импринтированных аллелей, изменений числа копий гена, а также вариантов некодирующей последовательности и находок при неменделирующих заболеваниях. Тем не менее, на настоящий момент система является модельной и предварительной, сложной для восприятия, и о широком ее распространении в клинической практике говорить преждевременно.
Последние научные и практические достижения в области исследований генома приводят к появлению новых методов и подходов к HTS и ДНК-диагностике, вследствие чего растет не только объем, но и разнообразие типов получаемых данных. В связи с этим актуализируется необходимость разработки новых руководств, охватывающих ранее не применявшиеся в клинике категории данных. Так, только за последний год было представлено сразу несколько документов, регламентирующих интерпретацию данных WGS, в том числе вариантов некодирующей части генома [16, 17]. Новые публикации подчеркивают необходимость интегрированного анализа результатов HTS с другими типами «больших данных», такими как данные секвенирования единичных клеток, ландшафт открытости хроматина, профили экспрессии и прочее [18, 19]. Создание алгоритмов интеграции различных типов омиксных данных для клинически релевантного анализа, по всей видимости, можно назвать одним из трендов развития клинической интерпретации генетических вариантов [20, 21] наряду с неуклонно возрастающим применением машинного обучения (machine learning, ML) и искусственного интеллекта. В настоящее время ML и искусственный интеллект успешно применяются для анализа определенных параметров классификации вариантов, к примеру, для предсказания функциональных эффектов [22, 23], однако последние публикации демонстрируют возможность использования этих технологий и непосредственно для замещения функций биоинформатика-интерпретатора [24]. Таким образом, очевидно, что развитие клинической интерпретации геномных данных в ближайшем будущем будет неразрывно связано с развитием искусственного интеллекта и вычислительных технологий в целом, хотя говорить о полном замещении искусственным интеллектом труда интерпретаторов и клиницистов, скорее всего, преждевременно.