Использование бактерий как хозяев для рекомбинантной ДНК требует выполнения ряда условий. Организм клеток хозяина должен иметь генотип, соответствующий эффективной репликации вектора. Оптимальными характеристиками хозяина являются: быстрый рост на недорогих средах, отсутствие патогенности, способность принять чужеродную ДНК и поддержание ее стабильности при культивировании. Бесспорным лидером при выборе штамма-хозяина являются бактерии E. coli. Выбор определяют фундаментальные знания генетики и биохимии этих микроорганизмов, секвенирована полная последовательность генома этих бактерий, для них разработаны и успешно применяются генно-инженерные методы. Недостатком является потенциальная опасность, связанная с условной патогенностью E. coli, средой обитания которых является кишечный тракт человека. Даже непатогенные штаммы E. coli продуцируют эндотоксины, которые контаминируют выделяемые ими продукты, включая лечебные препараты (инсулин, гормон роста человека). Кроме того, секретируемые белки
выделяются в периплазму и это обстоятельство затрудняет очистку, т.к. разрушение клеток ведет к дополнительной контаминации конечных продуктов. Основные достоинства B. subtilis в том, что они не патогенны и секретируют белки в среду. Тем не менее технология клонирования для них не развита так совершенно, как для E. coli. Другим ограничение является нестабильность бациллярных плазмид.
Итак, в зависимости от характеристики клеток-хозяев и величины клонированных фрагментов ДНК выбирают вектор-носитель (табл. 1):
Таблица 1. Векторы, используемые для молекулярного клонирования
Вектор | Оптимальная величина вставки, кб |
Плазмида | |
Вектор на основе фага l | |
Космида | |
Фазмида | |
Фагмида | До 100 |
Векторы на основе однонитевых фагов | До 100 |
ВАС и РАС | 124-300 |
|
Клонирование структурных генов эукариот
Из-за разницы в строении генов прокариот и эукариот клонирование генов эукариот осуществляется путем создания библиотеки кДНК. Процедура клонирования начинается с выделения фракции мРНК. мРНК можно отделить от рибосомной и транспортной РНК за счет присутствия в ее структуре поли(А)-сегмента на 3’-конце. Для этого суммарную клеточную РНК пропускают через колонку с целлюлозой, иммобилизованной с поли(Т)- последовательностями. За счет комплиментарного взаимодействия поли(Т) мРНК задерживается в колонке, а тРНК и рРНК проходят через нее. мРНК
элюируют денатурирующим буфером. Полученную фракцию мРНК используют в качестве матрицы для синтеза кДНК (Рис. 6).
Рис. 6. Синтез кДНК на основе мРНК [https://www.ncbi.nih.gov/book/ Modern Genetic Analysis/recombinant DNA technology]
Применяют две полимеразы: обратную транскриптазу и фрагмент Кленова. Обратная транскриптаза синтезирует ДНК с 3’-конца и обычно поворачивает вспять и присоединяет несколько нуклеотидов в обратном направлении с образованием шпильки. В реакционную смесь добавляют фрагмент Кленова, который достраивает вторую цепь ДНК, используя первую как матрицу. После окончания синтеза препарат обрабатывают РНКазой Р, которая разрушает молекулы мРНК, и нуклеазой S1, которая расщепляет петлю. В результате получают линейные молекулы ДНК с тупыми концами без шпилек. кДНК встраивают в плазмидный вектор и получают библиотеку из кДНК.
|
Блоттинги
Когда доступны мРНК и кДНК, их можно использовать в качестве гибридизационного зонда для качественной и количественной оценки присутствия индивидуальных генов в тотальной ДНК или РНК клетки без процедуры клонирования. Для этого служит метод блоттинг по Саузерну, по имени ученого, который его изобрел (1975 г.). Суть метода – перенос нуклеиновых кислот из агарозных гелей на нитроцеллюлозную бумагу (Рис. 7).
Рис. 7. Техника Саузерн-блота для определения присутствия специфического фрагмента ДНК в смеси рестриктов [https://www.ncbi.nih.gov/book/ Molecular Cell Biology /recombinant DNA and Genomics]
Сначала клеточную ДНК расщепляют рестриктазой (или рестриктазами) и фрагменты разделяют с помощью электрофореза в агарозном геле. Молекулы ДНК, разделенные по размеру, денатурируют щелочью, после нейтрализации щелочи, пластину геля покрывают листом нитроцеллюлозы, на нее помещают фильтровальную бумагу, которая должна обеспечить медленный ток буферного раствора через гель. В этих условиях ДНК диффундирует из геля и связывается с нитроцеллюлозным фильтром. После прогревания фильтра при 80оС ДНК необратимо иммобилизуется на нитроцеллюлозе. При этом расположение полос ДНК на фильтре точно соответствует их расположению в геле (реплика геля). ДНК, связанную с фильтром, можно гибридизовать с радиоактивно
меченым зондом, специфичным к определенной последовательности. В качестве такого зонда используют клонированный фрагмент ДНК, синтетический олигонуклеотид, мРНК или ее ДНК-копию. Меченый зонд гибридизуется с комплиментарной ДНК, полосы выявляют после радиоавтографии нитроцеллюлозного фильтра.
|
По такой же схеме на нитроцеллюлозный фильтр из агарозного геля можно перенести и молекулы РНК. Этот метод назван Северным блоттингом (Northern blotting), а перенос белков из геля на фильтры – Западным блоттингом (Western blotting). В качестве пробы в последнем анализе используют не ДНК, а иммунотела к тестируемым белкам. Три метода – мощный инструмент в детекции специфических макромолекул.
Секвенирование
После того как ген клонирован, начинается следующий этап анализа – секвенирование, или определение последовательности нуклеотидов. Последовательность нуклеотидов – определяющая характеристика гена, позволяющая дать заключение о функции.
Общий принцип. В основе секвенирования – получение фрагментов ДНК, различающихся по длине на один нуклеотид и меченых 32Р по 5’-концу. Молекулы разделяют электрофорезом в ПААГе. Определяется основание на конце каждого из фрагментов и устанавливается последовательность нуклеотидов.
Подвижность полос на электрофорезе обратно пропорциональна логарифму их длины: чем короче фрагмент, тем он ближе к 5’-концу.
5’ A C T G A
32Р--
32Р
32Р------
32Р---------
32Р------------
Исторически, для секвенирования использовали два подхода – химический и ферментативный.
Химический метод разработали А.Максам и В.Гилберт в 1976 г. Они секвенировали ДНК вируса SV40. Процедура начинается с присоединения метки к 5’ концам молекулы ДНК с помощью полинуклеотидкиназы фага Т4.
Рис. 8. Метод химического секвенирования ДНК [https://www.ncbi.nih.gov/book/Molecular Biology of the Cell/Basic Genetic Mechanisms]
Препарат меченой ДНК делят на четыре части (Рис. 8). Каждую часть обрабатывают реагентом, разрушающим одно из четырех оснований. Экспериментально подбирается такая концентрация реагента, что на 1 молекулу ДНК приходится одно повреждение. В месте повреждения образуется разрыв. Получается набор ДНК молекул длиною от метки до разрушенного основания. Если поврежденный нуклеотид, например А, находится на расстоянии 3, 8, 9 и 13 нуклеотидов от меченого фосфора, то обработка реагентом, разрушающим А ведет к образованию фрагментов длиной 3, 8, 9 и 13 нуклеотидов.
Наборы ДНК делят электрофорезом. Радиоавтограф отражает дистанцию от метки до разрушенного основания. Чтобы определить полную
последовательность, процедура выполняется одновременно в четырех пробирках, в которых реагенты, разрушающие А, Т, С и G. Пробирки разделяют на электрофорезе в четырех параллельных дорожках. Полосы читаются снизу вверх и следуют поочередно уровень за уровнем по любой из 4- х дорожек. Сопоставление полос на радиоавтографе позволяет читать последовательность нуклеотидов, переходя от уровня к уровню снизу вверх (5’
-> 3’).
Ферментативный метод (дидезоксисеквенирование). Определение нуклеотидной последовательности ДНК методом ферментативного копирования с помощью ДНК-полимеразы с остановкой удлинения цепи изобрел Ф. Сэнгер в 1977 г. Он впервые предложил применить модифицированные нуклеотиды – дидезоксирибонкулеотиды (ddNTP), у которых отсутствуют 3’- и 2’-OH группы. Модифицированные нуклеотиды способны включаться в растущие цепи ДНК через 5’-фосфатную группу, но не способны образовывать ФДЭ-связь со следующим нуклеотидом из-за отсутствия 3’-ОН группы. Если в реакционную смесь добавляют небольшое количество модифицированных нуклеотидов, то после их встраивания в ДНК синтез прекращается и образуется набор ДНК разной длины. Таким образом, для секвенирования можно поставить четыре реакции с каждым из модифицированных нуклеотидов и разделить продукты на электрофорезе.
В основе метода дидезоксисеквенирования – реакция синтеза ДНК in vitro. Матрицей для полимеризации является одноцепочечная ДНК, клонированная на однонитевом бактериофаге М13. В качестве стартового праймера для секвенирования любого чужеродного фрагмента, клонированного в М13 можно использовать один и тот же олигонуклеотид, расположенный радом со
вставкой, поскольку гетерологичную ДНК всегда клонируют в один и тот же участок М13.
Полимеризацию проводят в четырех пробирках (Рис. 9А).
Рис. 9. Метод Сенгера для секвенирования фрагментов ДНК [https://www.ncbi.nih.gov/book/ Molecular Cell Biology /recombinant DNA and Genomics]
В каждой из них присутствуют ДНК-матрица, которую предстоит секвенировать, меченый праймер, ДНК-полимераза, пул нормальных нуклеотидов в избытке, один из модифицированных нуклеотидов в строго определенных соотношениях (Рис. 9Б). В каждой из четырех пробирок образуется набор фрагментов ДНК разной длины в соответствии с местом встраивания модифицированных нуклеотидов (Рис. 9А). Продукты реакций анализируют электрофорезом в четырех параллельных дорожках (в соответствии с А, Т, G и С). Считывание радиоавтографа проводят также как и в химическом методе (рис.8).
Дидезоксисеквенированием идентифицируют первые 250-350 нуклеотидов вставки. Данные первого сиквенса используют для синтеза второго олигонуклеотидного праймера и с его помощью секвенируют следующие 250-
300 нуклеотидов. Процедуру продолжают до тех пор, пока не секвенируют весь фрагмент.
Автоматическое секвенирование включает автоматизацию проведения секвенирующих реакций и электрофоретического разделения меченых продуктов. При этом используется флуоресцентная метка. Каждый из четырех нуклеотидов метят различными флуоресцентными красителями. Содержание всех пробирок соединяют и проводят электрофорез на одной дорожке. Дорожку сканируют в луче лазера и регистрируют положение каждой флуоресцирующей полосы. Данные вводят в компьютер, который их сопоставляет с помощью специальных программ и выводит на дисплей нуклеотидную последовательность (Рис. 10).
Рис. 10. Автоматическое секвенирование с помощью флуоресцентных красителей. Каждому из четырех нуклеотидов соответствует свой индивидуальный краситель [https://www.ncbi.nih.gov/book/Modern Genetic Analysis/ recombinant DNA technology].
Первый автоматический ДНК-секвенатор разработан в 1987 г. фирмой Applied Biosystems (США). Позже для автоматического секвенирования наряду с пластинами использовали капиллярный гель-электрофорез. Для него характерны высокая чувствительность и высокая скорость разделения. Современные ДНК-секвенаторы существенно превосходят секвенирование
вручную, растет скорость секвенирования, постоянно улучшается техника и программное обеспечение. Это ведет к тому, что секвенирование ДНК становится простой и доступной процедурой.
При помощи сэнгеровского секвенирования расшифрован геном человека, но сейчас применяются секвенаторы нового поколения. В них участки ДНК многократно клонируются, но процесс чтения происходит по-другому. Один из новых методов - это секвенирование по методу Solexa (ныне Illumina) (рис. 11).
ДНК фрагментируется. К каждому участку ДНК с двух сторон добавляют адаптеры - известные небольшие последовательности нуклеотидов. Затем смесь помещается на подложку, на которой в виде решётки размещены участки ДНК, комплементарные адаптерам. Кроме того, адаптеры содержат праймеры для ДНК-полимеразы, которая осуществляет репликацию ДНК. На подложке фрагменты ДНВ многократно клонируют, получая кластеры. ДНК привязана к подложке сразу двумя концами. ДНК денатурируют. Подложка помещается в раствор, содержащий ДНК-полимеразу и помеченные нуклеотиды. После присоединения комплементарного нуклеотида лишние нуклеотиды смывают, а метки присоединившихся считывают. В технологии Illumina это флуоресцентные метки, которые можно заставить светиться разным цветом и сфотографировать. Затем ДНК обрабатывается фосфатазой и процесс повторяется. В результате на каждом цикле мы прочитываем одновременно очень большое число нуклеотидов из разных последовательностей. После секвенирования множества коротких фрагментов они собираются в единую молекулу ДНК (рис. 11).
Пиросеквенирование –определение последовательности нуклеотидов в ДНК по принципу «секвенирование путем синтеза». При включении нуклеотида во вновь синтезируемую последовательность ДНК высвобождается пирофосфат, который регистрируется посредством хемилюминесценции. Поскольку ДНК иммобилизована, растворы нуклеотидов A, C, G и T добавляют и отмывают поэтапно, после каждой реакции.
Рис. 11. Схема Illumina-секвенирования [https://postnauka.ru]
Последовательность растворов, которые дают хемилюминесцентный сигнал, позволяет определить последовательность ДНК. Когда полимераза включает комплементарный нуклеотид и высвобождается пирофосфат (PPi), фермент АТФ-сульфурилаза превращает PPi в аденозинтрифосфат (АТФ) в присутствии аденозин-5´-фосфосульфата. В присутствии АТФ люцифераза превращает люциферин в оксилюциферин с высвобождением видимого света, который регистрируется и анализируется компьютерной программой. Ораничением в применении этой технологии является длина последовательности нуклеотидов, которая составляет около 300-500 нуклеотидов.
Технология пиросеквенирования лицензирована 454 Life Sciences и в настоящее время приобретена Roche Diagnostics. Метод позволяет получать информацию о 400 миллионах нуклеотидах за 10-часовой период работы на одной установке. Методология включает следующие этапы (Рис. 12).
Рис 12. Схема пиросеквенирования (www.biomolecula.ru). А — ДНК фрагментируется, к фрагментам пришиваются олигонуклеотиды-«адаптеры»; полученные двуцепочечные молекулы ДНК разделяются на две комплементарные цепи. Б — Одноцепочечные молекулы ДНК прикрепляются к бусинкам в условиях, стимулирующих попадание лишь одной молекулы на бусинку. Отдельные бусинки заключаются в капли реакционной смеси, окруженные маслом. Количество молекул на бусинке увеличивается в миллионы раз в результате эмульсионной полимеразной цепной реакции (эПЦР). В — Эмульсия разбивается, и цепи ДНК-фрагментов, образовавшиеся в результате эПЦР, разделяются. Бусинки,
несущие на своей поверхности миллионы одноцепочечных копий первоначального фрагмента ДНК, помещаются в лунки оптико-волоконного слайда, по одной в каждую лунку. Г — В каждую лунку добавляются бусинки поменьше, несущие на своей поверхности ферменты, необходимые для пиросеквенирования. Д — Микрофотография эмульсии, изображающая «пустые» капли и капли, содержащие бусинки с ДНК-матрицей. Толстая стрелка указывает на 100-мкм каплю, тонкая — на 28-мкм бусинку. Е — Микрофотография фрагмента оптико-волоконного слайда, полученная при помощи сканирующего электронного микроскопа. Видна плакировка оптических волокон и пустые лунки.
ДНК, фрагментируют на кусочки по 300–500 пар оснований. Затем комплементарные цепи денатурируют, к каждой цепи фрагментов ДНК пришивают одинаковый для всех олигонуклеотид-«адаптер», который позволяет прикрепиться на пластиковые бусинки. Смесь фрагментов ДНК разбавляют так, что каждая бусинка получает по одной индивидуальной цепи. Затем каждая бусинка оказывается заключённой в капельку, окруженную маслом и содержащую смесь для полимеразной цепной реакции, которая проходит в каждой капельке эмульсии (эмульсионная ПЦР). Это приводит к
«клональной амплификации» цепей ДНК, на поверхности бусинки удерживается уже не одна, а около 10 млн копий («клонов») уникальной ДНК- матрицы. Далее двуцепочечные фрагменты ДНК, образовавшиеся в ходе ПЦР, разделяются и бусинки, несущие одноцепочечные копии ДНК-матрицы, помещают в лунки. Каждая лунка - это отдельный пиколитровый «реактор», в котором идет реакция секвенирования. Происходит поочередное добавление и удаление реагентов и продуктов реакции. Помимо бусинок с ДНК-матрицей, в каждую лунку добавляют более мелкие бусинки с иммобилизованными на поверхности ферментами, необходимыми для пирофосфатного секвенирования. Нуклеотиды подаются последовательно в проточную камеру, куда помещается слайд с лунками. Когда определённый нуклеотид встраивается в растущую цепь ДНК в лунке высвобождается молекула пирофосфата, которая является предшественником компонента другой ферментативной реакции. Её катализирует фермент - люцифераза светлячка Photinus pyralis. Для её
осуществления необходим аденозинтрифосфат (АТФ). Пирофосфат превращается в АТФ под действием фермента АТФ-сульфурилазы. В присутствии АТФ фермент люцифераза окисляет люциферин до оксилюциферина, эта реакция сопровождается хемилюминесценцией (вспышкой света), которая регистрируется для каждой индивидуальной лунки, в которой произошло встраивание известного нуклеотида.
Стремительно развиваются другие подходы. Платформа SOLiD (Supported Oligonucleotide Ligation and Detection System 2.0), разработанная Applied Biosystems — технология секвенирования коротких чтений, основанная на лигировании. По технологии SOLiD при секвенировании фрагменты ДНК лигируются на олигонуклеотидные адаптеры, прикрепленные к шарикам, далее они амплифицируются с помощью эмульсионной ПЦР.
Одномолекулярное секвенирование Helicos Biosiences - метод секвенирования единичных молекул, разработанный HeliScope (Helicos BioSciences) даёт информации около 1Gb/день. Принцип работы: после клональной амплификации образца происходит фрагментация ДНК с последующим полиаденилированием на 3'-конце с дальнейшим секвенированием, чередующимся с промыванием образцов нуклеотидами с флуоресцентной меткой.
Одномолекулярное секвенирование в реальном времени Pacific Biosciences (Single molecule real time sequencing, SMRT) основано на наблюдении за работой единичной молекулы ДНК-полимеразы. Использование четырех флюоресцентно меченных нуклеотидов позволяет определить какой нуклеотид присоединяет ДНК-полимераза в данный момент времени.
Ion Torrent Sequencing - Метод основан на связи между химической и цифровой информацией, что позволяет быстро секвенировать большое количество образцов. Технология также называется рН-индуцированным секвенированием. Процесс основан на детекции протонов, которые получаются при синтезе цепи ДНК как побочный продукт. Как следствие, рН раствора меняется, что и детектируют. Платформа Ion Torrent отличается от остальных
технологий секвенирования тем, что в ней не используются модифицированные нуклеотиды и оптические методы. Метод Ion Torrent позволяет исследовать транскриптомы, малые РНК, проводить ChIP-seq. Более того, с его помощью можно изучать геномы микробных сообществ.
Нанопоровое секвенирование - метод основан на измерении тока ионов через единичную нанопору в непроводящей мембране. При прохождении через эту пору нуклеотидов ток падает. Время, на которое изменяется ток ионов, и величина этого падения зависят от того, какой нуклеотид в данный момент находится внутри поры.
После сиквенса проводят поиск открытой рамки считывания (ORF) – последовательности, ограниченной старт- и стоп-кодонами. Выбор зависит от того, какое сочетание из трех нуклеотидов выбрано в качестве первого кодона. Возможны три рамки считывания одной и той же нуклеотидной последовательности. Кроме того, последовательность всегда читается в 5’ -> 3’ направлении, а значит, что в целом для одной последовательности возможны 6 различных рамок считывания (Рис. 13).
Рис. 13. Сканирование последовательности 9 кб-фрагмента ДНК выявило две большие ORF, 1 and 2, которые являются потенциальными генами [https://www.ncbi.nih.gov/book/Modern Genetic Analysis/ recombinant DNA technology].
Поиск проводят с помощью компьютерных программ, одна из них ORF Finder, расположена на сервере https://www.ncbi.nlm.nih.gov/goft. Проводят поиск гомологии последовательности с последовательностями, хранящимися в базах данных. Выравнивание и сравнительный анализ проводят с помощью
алгоритма программы BLAST, расположенной на сервере Национального института здоровья.
Растущее число секвенированных последовательностей заставило мировое сообщество задуматься об упорядочении их хранения. В 1982 г. на основе Национального института здоровья (NIH) был организован банк данных GenBank, его сервер в интернете: https://www.ncbi.nlm.nih.gov/genbank. GenBank содержит информацию, собранную со всего мира. В 1980 г. в Европе была создана база данных EMBL Data Library. Принцип обеих – обеспечение доступа к опубликованным нуклеотидным последовательностям, создание новых программных продуктов для информационного обеспечения исследований. Наряду с базами для генов, имеются базы хранения аминокислотных последовательностей, крупнейшей является SWISS-PROT. Базы для белков имеют компьютерное обеспечение, позволяющее сравнивать белки и продукты вновь секвенированных генов, на основании чего делается заключение о функции кодируемого геном продукта.
Четыре центра, включающие все известные последовательности ДНК, образуют глобальную сеть: National Center for Biotechnology Information (NCBI) содержит банк данных GenBank; European Bioinformatics Institute (EBI) содержит банк данных EMBL; Center for Informatio Biology (CIB) содержит DNA Databank of Japan (DDBJ). National Center for Genome Resources содержит Genome Sequence Database (GSDB). Банки обмениваются поступающими в них данными, что является основой единой мировой глобальной базы данных последовательностей. Каждая новая последовательность ДНК попадает в GenBank, EMBL, DDBJ или GSDB, а после обмена информацией между этими банками появляется в каждом из них. Каждой новой последовательности ДНК приписывается уникальный номер. Последовательности в банках данных сопровождаются аннотацией, содержащей всю известную биологическую информацию о последовательности (организм, кодируемый белок, положение инициирующего и терминирующего кодонов, интронов/экзонов и т.д.), а так же имя автора, название публикации, журнал, год, выпуск, страницы и пр.