Интрон-экзонная организация генов эукариот, сплайсинг. Структурная организация генома эукариот. Классификация повторяющихся элементов генома.




При изучении первичной структуры, т. е. последовательности нуклеотидов, ряда генов выяснилось, что в них, наряду с участками, кодирующими специфичный для этого гена продукт (полипептид, рРНК, тАНК и т. д.), имеются участки, которые ничего не кодируют, т. е. они подобно межгенным спейсерам (участкам между генами) не содержат генетической информации. Группы ученых, возглавляемых Р. Робертсом и П. Шарпом, обнаружили такие расщепленные гены у аденовируса 2 в 1977 г.

Некодирующие участки получили название интронов, кодирующие - экзонов. Такой тип структурной организации обнаружен для множества генов, локализованных в хромосомах эукариот, для некоторых генов внутриклеточных органелл эукариот - пластид и митохондрий, а также для генов нескольких РНК-содержащих и ДНК-содержащих вирусов, поражающих эукариот. У бактерий интронов в генах нет. Нет интронов и в генах вирусов, поражающих бактерии.

Число и внутригенная локализация интронов характерны для каждого гена, что стано вится очевидным в результате сравнения организации гомологичных генов у разных видов.

Некоторые гены содержат только один-два интрона, но часто их значительно больше. Так, например, в гене овальбумина курицы 7 интронов, в гене сывороточного альбумина крысы их 13, а один из генов коллагена курицы имеет даже 51 интрон. По результатам проекта «Геном человека», в 17 тыс. исследованных транскриптов у этого вида среднее число экзонов на транскрипт составило 7,8 [Venter et al., 2001]. Летальное исследование экзонов у 10 наиболее изученных модельных объектов показало, что у эукариот в среднем один ген содержит 3,7 интрона на 1 тпн кодирующего участка ДНК [Deutsch, Long, 1999].

У низших эукариот, таких как дрожжи, 95 % генов содержат только один экзон, значит, такие гены не прерываются интронами. У дрозофилы таких генов всего 17%, а у млекопитающих — 6 % (рис. 7.58).

Экзоны имеют, как правило, небольшую длину (рис. 7.59).

Длина интрона может быть разной — от нескольких десятков пар нуклеотидов до многих тысяч (рис. 7.60). Общая длина всех интронов часто значительно превышает суммарную длину экзонов. К примеру, из приблизительно 7 тпн, образующих ген овальбумина, на долю экзонов приходится всего 1872 пн, т. е. почти,, 3/4 длины составляют интроны. По данным; проекта «Геном человека», только 1 % ДНК генома приходится на экзоны и 24 % — на интроны, при этом размер гена (экзоны + интроны) составляет около 28 тпн [Venter et al., 2001].

Интроны транскрибируются наравне с экзонами, так что про-мРНК содержит участки, транскрибированные как с экзонов, так и с интронов. В дальнейшем в ходе процессинга, происходящего в ядре, участки про-мРНК, соответствующие интронам, вырезаются, а бывшие разобщенными участки, считанные с экзонов, «сращиваются», и зрелая мРНК содержит только транскрипты экзонов. Эти прежде разобщенные участки соединяются в нужном порядке (рис. 7.61). Воссоединение участков, транскрибированных с экзонов при образовании зрелой мРНК, называют сплайсингом (от англ. splicing — сращивание морских канатов). Длина гена существенно больше длины мРНК (табл. 7.1).

Интроны всегда (установлено для генов, кодирующих белки) имеют на 5'-конце пару последовательностей СТ, а на 3'-конце — AG.

Последовательности нуклеотидов в экзонах консервативны, а в интронах сильно варьируют. Иногда экзон одного гена может быть гомологичным экзону даже другого гена. Например, два β-глобиновых гена мыши имеют по три гомологичных экзона в каждом гене. Между интронами этих генов гомология не найдена, повидимому, из-за того, что интроны эволюционируют значительно быстрее, чем экзоны. При сравнении последовательностей нуклеотидов в одних и тех же генах у разных видов находят большую гомологию в экзонах.

Разные экзоны в пределах гена не только различаются по составу кодируемых ими аминокислот, но и имеют определенные структурные особенности. Например, в геноме человека обнаружено 30-45 тыс. так называемых CpG-островков. Это тяжи неметилированной ДНК с высоким содержанием динуклеотидов CpG. Чаще всего они располагаются в районах стартовых точек транскрипции. Вероятность найти CpG-островки в первых экзонах генов человека в 13 раз выше, чем в интронах, и в два раза выше, чем в других экзонах.

 

Размеры геномов в зависимости от таксономической принадлежности организмов Длинные молекулы геномной ДНК должны обладать способностью упаковываться в очень небольшом объёме. Ядра клеток эукариот и клетки бактерий имеют размеры ~ 10-6 м, в то же время в каждой клетке человека общая длина ДНК составляет ~ 2 м.

Геномы эукариот организованы существенно более сложно, чем геномы прокариот. Одна из характерных особенностей геномов эукариот - наличие кластеров изофункциональных генов. Изофункциональными называются гены, продукты экспрессии которых характеризуются структурно-функциональным сходством. В качестве примера подобных кластеров можно привести гены рРНК и гистонов. Эти гены тандемно повторяются в геномах и представлены большим числом идентичных копий. Типичный пример кластера генов - кластер бета-глобиновых генов человека, содержащий 5 генов и 1 псевдоген.
Каждый из генов экспрессируется на определенной стадии индивидуального развития организма. В состав кластеров изофункциональных генов могут входить псевдогены - последовательности геномной ДНК, структурно сходные с генами, однако лишённые функциональной активности. Вероятнее всего, они являются остатками когда-то функциональных генов. Например, псевдоген кластера бета-глобиновых генов человека гомологичен гену из этого же кластера, однако мутации в кодирующей части последовательности псевдогена привели к появлению стоп-кодонов во втором и третьем экзонах. Таким образом, этот мутантный ген потерял способность к полноценной экспрессии.
Наиболее вероятно возникновение в ходе эволюции генов одного кластера от общего предкового гена.
Гены эукариот отделены друг от друга районами нетранскрибируемой ДНК (межгенными спейсерами). У прокариот гены также отделены друг от друга спейсерами, однако длина спейсеров эукариот существенно больше. Низкая плотность кодирующих районов - общее свойство геномов эукариот, например, для человека она составляет около 2% (Bork et al., 1998).
Основной причиной того, что геномы эукариот имеют низкую кодирующую плотность, является наличие огромной фракции некодирующей ДНК, представленной повторяющимися последовательностями, межгенными спейсерами и интронами. В этом состоит существенное отличие геномов эукариот и прокариот.
В межгенных спейсерах, а также интронах могут располагаться различные типы повторяющихся последовательностей. Например, общая длина ДНК кластера бета-глобиновых генов человека составляет 73308 пар оснований (п.о.) (EMBL AC U01317). Из них 2.8% приходится на экзоны, 6.1% - на интроны, 8.6% - на различные типы повторяющихся последовательностей. Следует отметить, что насыщенность геномов прокариот повторяющимися последовательностями довольно низка (Kolchanov and Lim, 1994), в то время как для геномов эукариот высокая насыщенность повторами - одно из их характерных свойств.

Повторяющиеся последовательности могут иметь различную длину: от нескольких десятков п.о., до нескольких сот п.о. для диспергированных повторов и тысяч п.о. - для мобильных элементов.
Все повторы в геноме можно разделить на два класса:
1. Тандемные повторы, к которым относятся разные виды сателлитной ДНК, гены рРНК.
2. Диспергированные повторы, распределённые в геноме по принципу чередования с уникальными последовательностями. К этому классу относятся, в частности, различные типы перемещающихся (мобильных) элементов.
В настоящее время не существует детальной классификации повторяющейся ДНК. В обзоре (Heslop-Harrison, 2000) предложена следующая классификация:
1. Тандемные повторы, в которых одна копия следует за другой, так что массив повторяющейся ДНК может насчитывать сотни или тысячи отдельных копий. К этой категории относятся микросателлиты, размер мономера до 5 п.о., а также сателлитная ДНК с большей длиной мономера.
2. Ретроэлементы (мобильные элементы), распространение которых происходит посредством транскрипции. Полученная РНК далее служит матрицей для обратной транскрипции в ДНК, которая затем может встраиваться в определенные места геномной ДНК. К данной категории относятся различные классы диспергированных повторов.
3. Специальный класс повторов - теломерные повторы и рибосомная ДНК. Эти последовательности обладают определённой функцией в геноме: рДНК содержит гены, а теломерная ДНК образует структуры, стабилизируюшие концы хромосом. Теломерная ДНК по структуре сходна с тандемными повторами, размер мономера составляет 6-8 п.о.

В среднем на 1000 п.о. кодирующей ДНК у позвоночных приходится 5.6 интронов (Logsdon, 1998). Число экзонов в одном гене может быть даже больше сотни: например, ген титина (EMBL AC AJ277892) имеет не менее 157 экзонов, так что их общая длина превышает 28347 п.о.

Строение генов эукариот, в отличие от прокариот, характеризуется наличием экзон-интронной структуры. В состав первичного транскрипта - пре-мРНК входят как экзоны, так и интроны (некодирующие районы). В процессе сплайсинга интроны вырезаются из пре-мРНК. Оставшиеся же части - экзоны - объединяются в зрелую матричную РНК (мРНК), которая может транслироваться в белок.

Сайты, по которым происходит вырезание интронов, называют сайтами сплайсинга. Сплайсинг одного гена может происходить несколькими способами. Это означает, что в состав зрелых мРНК могут входить разные комбинации экзонов. Для большинства зрелых мРНК размер составляет от нескольких сот п.о. до 10000 п.о. Максимальная длина зрелой мРНК достигает 80880 п.о. (AC X90568, белок титин, экспрессирующийся в мышечной ткани сердца). В состав первичного транскрипта (пре-мРНК) входят 5' и 3' нетранслируемые районы - 5'UTR и 3'UTR, соответственно.

Район, узнаваемый РНК-полимеразой как финиш транскрипции называется районом терминации транскрипции. В 3' нетранслируемом районе гена - 3'UTR может находиться также контекстный сигнал полиаденилирования.

Сравнение распределений длин экзонов и интронов для разных видов эукариот позволяет заключить, что в направлении от низших эукариот (грибов и беспозвоночных) к высшим (позвоночным) наблюдаются следующие закономерности:

 Средний размер экзона уменьшается;

 Средний размер интрона увеличивается;

 Увеличивается общее число экзонов и интронов;

 


46.Семейства генов. Псевдогены. Регуляторные элементы генома.

Все гены, принадлежащие к определенной геномной группе повторенных последовательностей, называют генным семейством или мультигенным семейством. Члены мультигенного генного семейства обычно находятся на одной хромосоме рядом друг с другом. В некоторых случаях какие-нибудь функциональные или нефункциональные члены семейства могут находиться на другой хромосоме.

Когда дуплицированные гены начинают значительно различаться друг от друга либо функционально, либо по составу последовательности, становится не слишком удобно относить их к одному и тому же семейству. Термин суперсемейство был предложен Dayhoff (1978) для того, чтобы ввести некоторое разграничение между близкородственными и более дивергировавшими белками. Согласно этой классификации белки, демонстрирующие по-крайней мере 50% сходства на аминокислотном уровне, считаются членами семейства, тогда как гомологичные белки сходные менее чем на 50% считаются членами суперсемейства. Например, альфа- и бета-глобиновые гены относятся к двум различным семействам, а вместе с миоглобином они образуют суперсемейство глобинов. Однако, эти два термина (семейство и суперсемейство) не всегда возможно использовать строго согласно критериям, предложенным Dayhoff. Например, альфа-глобиновые цепи человека и карпа демонстрируют только 46% сходства, что ниже соответствующего предела для отнесения их к одному семейству. Поэтому классификацию белков на семейства и суперсемейства проводят не только на основе сходства последовательностей, но и на основе некоторой дополнительной информации, касающейся функционального сходства или тканевой специфичности.

Число генов внутри генного семейства значительно варьирует. Некоторые гены повторены в геноме всего несколько раз и относятся к так называемым низкоповторенным генам. Другие могут повторяться в геноме сотни раз и называются высокоповторенными генами.

Псевдогены

Иногда в геномах встречаются так называемые псевдогены. Они имеют все необходимые черты генов, т. е. полный набор экзонов, характерных для каких-то генов, поли(Т)-хвосты и короткие прямые повторы длиной 10-20 пн (как у мобильных элементов), однако остаются функционально неактивными. Существуют 2 типа псевдогенов:

1. Традиционные псевдогены (семейство генов глобинов). Они возникают за счет дупликаций определенных генов, которые затем выключаются в результате делеций и точковых мутаций.

2. Процессированные псевдогены. У них нет интронов, но есть остатки поли(А)-тракта; по флангам чаще всего находят прямые повторы. Такие псевдогены часто встречаются у млекопитающих и редко — у дрожжей.

У дрозофилы псевдогены встречаются редко, чаще это гены транспортных или малых ядерных РНК (тАНК, snRNA). Еще один известный пример — псевдоген личиночного кутикулярного белка и псевдоген Adh y D. mulleri, они сохраняют свои интроны. Пример процессированного псевдогена (т. е. без интронов) описан для гена Adh y D. teissieri.

В геноме человека, как полагают, не менее 3 тыс. последовательностей можно рассматривать в качестве псевдогенов [Venter et а1., 2001].





©2015-2017 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Нарушение авторских прав и Нарушение персональных данных

Обратная связь

ТОП 5 активных страниц!