Теоретический обзор
Ген — единица наследственности [участок дезоксирибонуклеиновой кислоты (ДНК), с которого копируется рибонуклеиновая кислота (РНК)], занимающая специфическое место (локус) в хромосоме, способная к самовоспроизведению в клеточном цикле. Термин «ген» был предложен в 1909 г. датским ботаником Вильгельмом Йогансеном. В 1920 г. Ганс Винклер ввёл понятие генома — совокупности генов, заключённых в гаплоидном наборе хромосом организмов одного биологического вида. Геном человека длиной 3,2 млрд пар нуклеотидов (п.н.) расшифрован в 2003 г., содержит примерно от 20 000 до 25 000 генов. Окончательное количество генов не установлено.
Структура гена эукариот
Размеры генов варьируют от 250 п.н. (ген IGF2 — инсулиноподобный фактор роста II, 67 аминокислот) до 2,2 млн п.н. (ген DMD — дистрофин, 3685 аминокислот). Общепринятая модель строения гена — экзон-интронная структура (рис. 5.1).
Экзон — последовательность ДНК, которая представлена в зрелой РНК. В составе гена должен присутствовать как минимум один экзон [например, в генах транспортной рибонуклеиновой кислоты (тРНК), гистонов]. Максимальное количество экзонов представлено в гене мышечного белка титина — 364 экзона. В среднем в гене содержится 8 экзонов.
- Фактор инициации транскрипции 5’-ACTT(T/C)TG-3’ входит в состав первого экзона.
- Фактор терминации транскрипции (менее определённая последовательность) входит в состав последнего экзона.
Рис. 5.1. Структура и экспрессия гена. КЭП-сайт (от англ. cap — шапка) — нуклеотид на 5’-конце транскриптов, синтезированных РНК-полимеразой II
[по: Boron W.F., Boulpaep E.L., 2003]
Интрон — последовательность ДНК, включённая между экзонами, не входит в состав зрелой РНК. Интроны имеют определённые нуклеотидные последовательности, обусловливающие их границы с экзонами: на 5’-конце — GU последовательность, на 3’-конце — AG. Интроны содержат регуляторные элементы экспрессии гена и могут кодировать регуляторные РНК, например короткие интерферирующие РНК (см. ниже).
Сигнал полиаденилирования 5’-AATAAA-3’ входит в состав последнего экзона, начинается сразу после стоп-кодона (ТАА, TAG, TGA). Поли(А) сайты защищают матричную рибонуклеиновую кислоту (мРНК) от деградации.
5’- и 3’-фланкирующие последовательности. Копирование гена происходит в направлении 5’ → 3’; на флангах (границах) находятся специфические сайты, ограничивающие ген и содержащие регуляторные элементы его транскрипции.
Регуляторные элементы — промотор, энхансеры, сайленсеры, инсуляторы — могут находиться за пределами сайта транскрипции и быть общими для нескольких генов.
- Промотор (от англ. promoter — «активатор», «ускоритель») — цис-регуляторная последовательность в 5’-области гена, определяющая место прикрепления РНК-полимеразы и интенсивность (частоту) транскрипции мРНК. Содержит ТАТА-бокс для связывания основного фактора транскрипции TFIID. Проксимальнее ТАТА-бокса содержатся GC-бокс (5’-GGGCGG-3’) и CAAT-бокс (5’-CCAAT-3’) для связывания дополнительных специфических белков, активирующих экспрессию генов. Активация только промотора недостаточна для экспрессии гена на физиологически значимом уровне.
- Энхансеры (от англ. enhance — «усиливать»), цис-позитивные регуляторные элементы, и сайленсеры (от англ. silence — «успокаивать» (гл.); «тишина» (сущ.)), цис-негативные регуляторные элементы, состоят из 6‒12 нуклеотидов, специфически взаимодействующих с белками. Энхансеры связываются с белками-активаторами и усиливают экспрессию гена. Сайленсеры связываются с белками-репрессорами и блокируют экспрессию гена. Энхансеры и сайленсеры локализуются в 5’- или 3’- фланкирующих участках, или интронах. Активность не зависит от их ориентации или локализации. Кроме того, они могут находиться на больших расстояниях от промотора (несколько сотен п.н.) и взаимодействуют с ним за счёт образования петель ДНК.
- Инсуляторы (англ. MAR — matrix attachment regions). Образуют дискретные функциональные домены — петли хромосом, ограничивающие влияние соседних регуляторных элементов. В состав петли могут входить специфические последовательности, контролирующие локус (англ. LCR — locus-control region) — позитивные цис-элементы, регулирующие активность нескольких генов (рис. 5.2).
Последовательность, контролирующая локус (LCR), впервые открыта в гене β-глобина. Семейство генов β-глобина включает в себя 5 генов (ε, γG, γA, δ, β) на 11-й хромосоме. Гены активируются последовательно от 5’- к 3’-концу в онтогенезе в эритроидных клетках. β-Глобин экспрессируется в желточном мешке, γG- и γA-глобины — в печени плода, ε- и δ-глобины — в красном костном мозге в постнатальном периоде.
Рис. 5.2. Регуляторные элементы экспрессии гена [по: Boron W.F., Boulpaep E.L., 2003]
Последовательность, контролирующая локус, связывает факторы транскрипции GATA1 и NF-E2, изменяет форму хроматина, делая его доступным для факторов транскрипции, и выступает в роли энхансера.
Талассемия — гетерогенная группа генетических дефектов, характеризующихся отсутствием или сниженной экспрессией генов, кодирующих α- (α-талассемия) или β- (β-талассемия) цепи глобинов. При мутациях генов нарушается или полностью блокируется образование одной или нескольких цепей глобина, что приводит к развитию анемии. В случае β-талассемии мутации могут затрагивать последовательности, контролирующие локус.