Общие данные
В хромосомной ДНК выделяют два класса последовательностей нуклеотидов (см. главу 2): уникальные последовательности или экзоны (они реплицируются и транскрибируются), и повторяющиеся последовательности или интроны (они реплицируются, но, как правило, не транскрибируются).
Последовательности ДНК разнообразны по спектру: ди-, три-, тетра-, пента-, гекса- и полинуклеотидные. При этом ди-, тетра- и пентануклеотидные последовательности редко обнаруживаются в экзонах, тогда как три- и гексануклеотидные последовательности в них выявляются часто, что объясняется способностью первых и неспособностью вторых к сдвигу рамки считывания в ходе транскрипции. Установлена прямая связь между длиной (размером) последовательности, ее стабильностью и изменчивостью в популяции. При этом размер последовательности важный, но не единственный фактор, влияющий на ее стабильность.
В свою очередь, стабильность экзонов и интронов связана со степенью их «чистоты». Например, информативность последовательности со вставками нуклеотидов или маркерами, нарушающими ее непрерывность, значительно ниже, чем у последовательностей без таких вставок. Потеря вставок в экзонах - это, как правило, результат формирования делеции или однонуклеотидной замены (например, аденина на цитозин), что ведет к образованию неканонической (не «уотсон-криковской») пары азотистых оснований.
Наряду с информативностью последовательностей ДНК показана ассоциативная связь между их нестабильностью и степенью совершенства. Так, нормальные аллели гена SCA1 (ген спиноцеребеллярной атаксии, тип I) имеют большую длину повтора CAG, содержат 1-3 вставки повтора САТ, тогда как аллели с экспансией копий повторов характеризуются непрерывными трактами СAG.