Базы данных по геномам E Coli
Реферат
Подготовил:
студентка 2 курса маг. _____ Ганем Афрах.
Проверил:
к.б.н., доцент______________ Федорин Д.Н.
Воронеж 2020
СОДЕРЖАНИЕ
1. ВВЕДЕНИЕ........................................................................................................3
2. Общие характеристики последовательности ДНК генома E. coli K12..........4
3. БАЗА ДАННЫХ GenBank..................................................................................6
3.1.GenBank (NCBI)...........................................................................................6
4. Escherichia coli str. K-12 substr. MG165.............................................................7
5. База данных EcoCyc..........................................................................................10
5.1.ПЦР-детекция и картирование генов о-антигена E. Coli...........................12
6. Заключение.........................................................................................................13
7. Литература.........................................................................................................14
Введение
В настоящее время научная работа связана не только, и даже не сколько с работой в лаборатории и постановкой экспериментов. Сейчас на первый план выходит работа с базами данных различного содержания Они помогают ученым определить поле деятельности, наметить области работы. В настоящее время распространены TrEMBL, SwissProt, PIR, OWL, PDB.
Пополняться Кишечная палочка Escherichia coli - классический объект молекулярной генетики, на котором исследованы наиболее принципиальные проблемы организации генетического материала. Штамм E. coli K12 был успешно использован Дж.Ледербергом и Э.Тейтумом в 1946 г. для доказательства существования рекомбинаций у бактерий. Позже Дж.Ледерберг построил для нее первую генетическую карту, а Ф.Жакоб и Э.Вольман - первую кольцевую карту. В 1963 г. Дж.Кернс сфотографировал кольцевой геном E. coli в процессе его репликации.
Клеточный геном представляет собой сбалансированную систему генов - архив генетической информации, достаточной для контроля всего клеточного метаболизма, развития, морфогенеза, самовоспроизведения. В частности, геном клетки содержит гены всех основных генетических процессов - репликации, транскрипции, трансляции, репарации, рекомбинации, сегрегации и т.д. Полное секвенирование генома позволяет сопоставить и оценить генетическую сложность тех или иных молекулярных систем и геномов, выявить ранее неизвестные гены, выполнить сравнительный анализ функционального и структурного сходства различных генов и геномов, выявить общие принципы организации сложных клеточных молекулярно-генетических систем управления.
Работа по проекту полного секвенирования генома E. coli K12 была начата в 1991 г. под руководством д-ра Фреда Блаттнера (лаборатория генетики, Висконсинский университет, г. Медисон, США). В январе 1997 г. основные результаты были переданы в компьютерную базу данных GenBank, а в сентябре 1997 г. в американском журнале "Science" появилась итоговая статья коллектива участников секвенирования. Полная последовательность ДНК генома E. coli K12 стала достоянием науки. Ниже мы приведем в сводной форме основные результаты этих работ с необходимыми комментариями, имея в виду, что такой уникальный материал позволяет ответить на многие принципиальные вопросы молекулярно-генетической организации и эволюции
Общие характеристики последовательности ДНК генома E. coli K12
87,8% генома занимают реальные и вероятные белок-кодирующие гены, или цистроны. Примерно 1/3 из них была известна ранее, а остальные выбраны среди огромного числа новых открытых рамок трансляции (возможных цистронов, или ORF) путем сложного сопоставления многих свойств, имеющих характерные различия между кодирующими и некодирующими районами. Функции 38% этих цистронов неизвестны.
- 0,8% - гены стабильных фракций РНК (т-РНК, р-РНК и др.).
- 0,7% - некодирующие повторы.
- 11,0% генома - функциональные сайты и другие участки, выполняющие регуляторные и другие функции.
Таким образом, геном E. coli K12 очень плотно нагружен генами (~ 88,5%), а межгенные участки занимают относительно малую долю (~11%). Среди 4288 выявленных или предсказанных цистронов 1853 описаны ранее, а 2435 - новые. Самый большой цистрон содержит 7149 нп. (2383 кодона), функция его неизвестна. Средний размер цистрона 951 нп. (317 кодонов). Средний интервал между цистронами - 118 нп. Однако межгенны интервалы в большинстве своем содержат различные функциональные сайты, то есть выполняют регуляторные функции. Кроме того, цистроны не содержат интронов - внутренних некодирующих участков.
Известно, что цистроны выделяются в ДНК и м-РНК начальными и конечными знаками пунктуации. В общей форме они были известны ранее и внесены в генетический код. Однако в геноме E. coli они встречаются с различными частотами:
Начальные знаки пунктуации | Конечные знаки пунктуации |
ATG - 3542 | TAA - 2705 |
GTG - 612 | TGA - 1257 |
TTG - 130 | TAG - 326 |
ATT - 1 | CTG - 1 |
Интересно, что у 405 пар смежных цистронов вообще нет межгенных интервалов: знак начала трансляции одного частично перекрывается с конечным знаком другого:
(нач) (нач) (нач) (нач)
ATGA, TAATG, TGATG, GTGA, и др.
[кон][кон] [кон] [кон]
По данным на январь 1998 г. сложность молекулярно-генетической системы управления и метаболической сети E. coli можно охарактеризовать следующим образом:
1. Длина ДНК генома (Мб) | 4.6 |
2. Полное число генов | |
3. Число цистронов | <4288/td> |
4. Число кодируемых ими ферментов | |
5. Число метаболических реакций | |
6. Число метаболических путей | |
7. Число химических веществ, участвующих в метаболизме | |
8. Число фракций т-РНК (генов т-РНК) | 79 (86) |
9. Число регуляторных белков |
В таких случаях специалисты говорят: "жизнь при 4909 генах". Метаболизм сложен, но не запредельно. В дальнейшем приведенные цифры могут возрасти в ходе исследований за счет новых знаний.
БАЗА ДАННЫХ GenBank
GenBank – база данных генетических последовательностей, поддерживается NIH (Национальный Институт Здоровья США), аннотированная база известных последовательностей ДНК, РНК и белков, с литературными ссылками на первоисточники и информацией биологического характера. Обновляется каждые два месяца. Является частью International Nucleotide Sequence Database Collaboration, которая объединяет трикрупнейшие коллекции нуклеотидных последовательностей: DDBJ (NIG), EMBL (EBI) и GenBank (NCBI).
GenBank (NCBI)
Кишечная палочка к-12 является наиболее широко изученным штаммом кишечной палочки ислужит эталоном для этого вида. Кишечная палочка также является одним из самых разнообразных видов микробов, содержащих как патогенные, так и непатогенные штаммы. Патогенная кишечная палочка может вызывать инфекции мочевыводящих путей, неонатальный менингит и многие, часто тяжелые, кишечные заболевания. Патогенные штаммы часто имеют факторы вирулентности, кодируемые на экстрахромосомных плазмидах или внутри бактериофагов и отдельных сегментов ДНК, называемых островками патогенности (PAIs). Паи, вероятно, были перенесены горизонтально и, возможно, даже интегрировались в хромосому посредством интеграции или транспозиции бактериофагов или плазмид. Эти факторы вирулентности часто переносились от близкородственных, высокопатогенных видов шигелл. Среди других факторов вирулентности энтероинвазивная кишечная палочка делит инвазионную плазмиду с шигеллой.Эталонными штаммами из патогенной кишечной палочки являются возбудители мочевыводящих путей Escherichia coli IAI39 и Escherichia coli UMN026, Escherichia coli O157:H7 str. Сакаи, вызывающий геморрагический колит, Escherichia coli O83: H1 str. NRG 857C, который вовлечен в болезнь Крона, и Escherichia coli O104:H4 str. 2011C-3493, которые вызывают гемолитический уремический синдром.