последовательность генома Определение последовательности ДНК-генома этого штамма проводилось или проводится либо полностью, либо частично.
Escherichia coli str. K-12 substr. MG1655
- Escherichia coli MV1994
- Escherichia coli MV2A6
- Escherichia coli MV2A9
- Escherichia coli MV2B10
- Escherichia coli MV2B9
- Escherichia coli MV2C11
- Escherichia coli MV2C9
- Escherichia coli MV2D10
- Escherichia coli MV2D4
- Escherichia coli MV4241
- Escherichia coli MV4242
- Escherichia coli MV4243
- Escherichia coli MV4244
- Escherichia coli MV4246
- Escherichia coli MV7501
- Escherichia coli MV7502
- Escherichia coli MV7503
- Escherichia coli MV7505
- Escherichia coli MV7506
- Escherichia coli PFM2
- Escherichia coli str. K-12 substr. MG1655star
- synthetic Escherichia coli C321.deltaA
strain | |||
JW5437-1 [1 2 4408] | K-12 [10 4629 211 7395 4670 10 36920 4747 10] | K-12 substr. MG1655 [6 21 16 207 6 245] | K12 ![]() |
K12 MG1655 [6 193 58 218] | K12 substr. MG1655 ![]() | MG1655 ![]() | VB111_IA [1 444] |
VB111_IB [1 662] | VB111_IC [1 694] | VB111_ID [1 424] | VB111_IE [1 484] |
VB111_IF [1 438] | VB111_IG [1 440] | VB111_VA [1 852] | |
substrain | |||
MG1655 [3 5020 51 8 4924] | |||
isolate | |||
MG1655 [32 1 2 40] | ncec3 [3904] | ||
nat-host | |||
Homo sapiens [9] | |||
culture-collection | |||
ATCC:47076 [2 29 4407 1] |
Модификаторы организма
Геном E. coli K12 содержит также значительное число необязательных (факультативных) включений - профагов, плазмид и транспозонов. Выявлено 87 цистронов и белков этих включений. Число их может быть различным, поскольку они подвижны, способны к внедрению в геном и выщеплению из него. Наилучшим образом это продемонстрировано для умеренного фага l и полового фактора (плазмиды) F, которые в данной линии отсутствуют. Многие фаги исключаются из генома не полностью, оставляя там в качестве следа некоторые свои гены. Эти остатки, не способные к самостоятельному перемещению и развитию, называют "криптическими" фагами. Среди факультативных включений в этой линии найдены 41 копия различных транспозонов (IS), которые участвуют в процессах внедрения и исключения плазмид.
|
Наконец, следует отметить, что геном E. coli содержит ряд функциональных и нефункциональных повторов. Октамер GCTGGTGG отвечает "горячим точкам рекомбинаций" (так называемым). Он встречается в сотнях позиций в обеих ориентациях и играет ключевую роль в конъюгационной рекомбинации и других генетических процессах. Найдено большое число копий (581) небольшого палиндромного повтора REP длиной ~ 40 нп. Функция их неизвестна. В сумме они занимают 0,54% ДНК генома. Известны и другие повторы. В основном они попадают в межцистронные интервалы.
Escherichia coli str. K-12 substr. MG1655, complete genome
AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTCTGTGTGGATTAAAAAAAGAGTGTCTGATAGCAGC
TTCTGAACTGGTTACCTGCCGTGAGTAAATTAAAATTTTATTGACTTAGGTCACTAAATACTTTAACCAA
TATAGGCATAGCGCACAGACAGATAAAAATTACAGAGTACACAACATCCATGAAACGCATTAGCACCACC
ATTACCACCACCATCACCATTACCACAGGTAACGGTGCGGGCTGACGCGTACAGGAAACACAGAAAAAAG
CCCGCACCTGACAGTGCGGGCTTTTTTTTTCGACCAAAGGTAACGAGGTAACAACCATGCGAGTGTTGAA
GTTCGGCGGTACATCAGTGGCAAATGCAGAACGTTTTCTGCGTGTTGCCGATATTCTGGAAAGCAATGCC
AGGCAGGGGCAGGTGGCCACCGTCCTCTCTGCCCCCGCCAAAATCACCAACCACCTGGTGGCGATGATTG
AAAAAACCATTAGCGGCCAGGATGCTTTACCCAATATCAGCGATGCCGAACGTATTTTTGCCGAACTTTT
GACGGGACTCGCCGCCGCCCAGCCGGGGTTCCCGCTGGCGCAATTGAAAACTTTCGTCGATCAGGAATTT
GCCCAAATAAAACATGTCCTGCATGGCATTAGTTTGTTGGGGCAGTGCCCGGATAGCATCAACGCTGCGC
TGATTTGCCGTGGCGAGAAAATGTCGATCGCCATTATGGCCGGCGTATTAGAAGCGCGCGGTCACAACGT
TACTGTTATCGATCCGGTCGAAAAACTGCTGGCAGTGGGGCATTACCTCGAATCTACCGTCGATATTGCT
GAGTCCACCCGCCGTATTGCGGCAAGCCGCATTCCGGCTGATCACATGGTGCTGATGGCAGGTTTCACCG
CCGGTAATGAAAAAGGCGAACTGGTGGTGCTTGGACGCAACGGTTCCGACTACTCTGCTGCGGTGCTGGC
TGCCTGTTTACGCGCCGATTGTTGCGAGATTTGGACGGACGTTGACGGGGTCTATACCTGCGACCCGCGT
CAGGTGCCCGATGCGAGGTTGTTGAAGTCGATGTCCTACCAGGAAGCGATGGAGCTTTCCTACTTCGGCG
CTAAAGTTCTTCACCCCCGCACCATTACCCCCATCGCCCAGTTCCAGATCCCTTGCCTGATTAAAAATAC
CGGAAATCCTCAAGCACCAGGTACGCTCATTGGTGCCAGCCGTGATGAAGACGAATTACCGGTCAAGGGC
ATTTCCAATCTGAATAACATGGCAATGTTCAGCGTTTCTGGTCCGGGGATGAAAGGGATGGTCGGCATGG
CGGCGCGCGTCTTTGCAGCGATGTCACGCGCCCGTATTTCCGTGGTGCTGATTACGCAATCATCTTCCGA
ATACAGCATCAGTTTCTGCGTTCCACAAAGCGACTGTGTGCGAGCTGAACGGGCAATGCAGGAAGAGTTC
TACCTGGAACTGAAAGAAGGCTTACTGGAGCCGCTGGCAGTGACGGAACGGCTGGCCATTATCTCGGTGG
TAGGTGATGGTATGCGCACCTTGCGTGGGATCTCGGCGAAATTCTTTGCCGCACTGGCCCGCGCCAATAT
|
CAACATTGTCGCCATTGCTCAGGGATCTTCTGAACGCTCAATCTCTGTCGTGGTAAATAACGATGATGCG
ACCACTGGCGTGCGCGTTACTCATCAGATGCTGTTCAATACCGATCAGGTTATCGAAGTGTTTGTGATTG
GCGTCGGTGGCGTTGGCGGTGCGCTGCTGGAGCAACTGAAGCGTCAGCAAAGCTGGCTGAAGAATAAACA
TATCGACTTACGTGTCTGCGGTGTTGCCAACTCGAAGGCTCTGCTCACCAATGTACATGGCCTTAATCTG
GAAAACTGGCAGGAAGAACTGGCGCAAGCCAAAGAGCCGTTTAATCTCGGGCGCTTAATTCGCCTCGTGA
AAGAATATCATCTGCTGAACCCGGTCATTGTTGACTGCACTTCCAGCCAGGCAGTGGCGGATCAATATGC
CGACTTCCTGCGCGAAGGTTTCCACGTTGTCACGCCGAACAAAAAGGCCAACACCTCGTCGATGGATTAC
TACCATCAGTTGCGTTATGCGGCGGAAAAATCGCGGCGTAAATTCCTCTATGACACCAACGTTGGGGCTG
GATTACCGGTTATTGAGAACCTGCAAAATCTGCTCAATGCAGGTGATGAATTGATGAAGTTCTCCGGCAT
TCTTTCTGGTTCGCTTTCTTATATCTTCGGCAAGTTAGACGAAGGCATGAGTTTCTCCGAGGCGACCACG
CTGGCGCGGGAAATGGGTTATACCGAACCGGACCCGCGAGATGATCTTTCTGGTATGGATGTGGCGCGTA
AACTATTGATTCTCGCTCGTGAAACGGGACGTGAACTGGAGCTGGCGGATATTGAAATTGAACCTGTGCT
GCCCGCAGAGTTTAACGCCGAGGGTGATGTTGCCGCTTTTATGGCGAATCTGTCACAACTCGACGATCTC
TTTGCCGCGCGCGTGGCGAAGGCCCGTGATGAAGGAAAAGTTTTGCGCTATGTTGGCAATATTGATGAAG
ATGGCGTCTGCCGCGTGAAGATTGCCGAAGTGGATGGTAATGATCCGCTGTTCAAAGTGAAAAATGGCGA
AAACGCCCTGGCCTTCTATAGCCACTATTATCAGCCGCTGCCGTTGGTACTGCGCGGATATGGTGCGGGC
AATGACGTTACAGCTGCCGGTGTCTTTGCTGATCTGCTACGTACCCTCTCATGGAAGTTAGGAGTCTGAC
ATGGTTAAAGTTTATGCCCCGGCTTCCAGTGCCAATATGAGCGTCGGGTTTGATGTGCTCGGGGCGGCGG
TGACACCTGTTGATGGTGCATTGCTCGGAGATGTAGTCACGGTTGAGGCGGCAGAGACATTCAGTCTCAA
GCAAGCCGTAACCCAGGGGTTGGGCAAAAATCAGGGGCTGTTTTTTCCGCACGACCTGCCGGAATTCAGC
База данных EcoCyc
это биологическая база данных по бактерии Escherichia coli к-12. Проект EcoCyc осуществляет основанное на литературе кураторство генома E. coli, а также транскрипционной регуляции E. coli, транспортеров и метаболических путей. EcoCyc содержит письменные резюме генов E. coli, полученные из более чем 36 000 научных статей. EcoCyc - это также описание генома и клеточных сетей E. coli, которое помогает ученым проводить вычислительный анализ.
Объекты данных в базе данных EcoCyc описывают каждый ген E. coli и генный продукт. Объекты базы данных также описывают молекулярные взаимодействия, включая метаболические пути, транспортные события и регуляцию экспрессии генов. EcoCyc предоставляет несколько инструментов визуализации в масштабе генома, чтобы помочь в анализе данных omics, таких как окрашивание экспрессии генов или метаболомических данных в полную регуляторную сеть E. coli.
|
Доступ к EcoCyc можно получить через веб-сайт EcoCyc в виде набора загружаемых файлов и в сочетании с программным обеспечением Pathway Tools, которое может быть установлено локально на компьютерах Macintosh, PC/Windows и PC/Linux. Загружаемое программное обеспечение предоставляет возможности, которые выходят далеко за рамки веб-версии EcoCyc.
На протяжении многих десятилетий тысячи исследователей внесли свой вклад в экспериментальное изучение кишечной палочки. Учитывая его умеренный размер генома, который содержит примерно 4500 генов, легко предположить, что мы уже знаем большую часть того, что нужно знать о E. coli—ее гены, генные продукты и их функции, а также ее клеточный метаболизм и взаимодействие с окружающей средой. На самом деле, однако, многие аспекты биологии кишечной палочки все еще неизвестны; например, все еще существует ряд существенных генов неизвестной функции (например. Базовая Е. исследования кишечной палочки продолжают генерировать удивительные открытия, а новые экспериментальные методы позволяют исследователям заполнить пробелы в наших знаниях и решить давние загадки. Поскольку кишечная палочка служит образцовой бактерией для многих менее хорошо изученных организмов, новые открытия должны иметь широкое влияние. Одним из наиболее важных видов использования базы данных модельных организмов, таких как EcoCyc, является сбор и распространение как давних знаний, так и последних достижений в области исследований в легкодоступном формате. EcoCyc продолжает выполнять эту роль для E. исследовательское сообщество coli и его интеграция в коллекцию BioCyc, состоящую из тысяч специфичных для организма баз данных, обеспечивает простой способ поиска и сравнения ортологичных генов и метаболических путей в широком спектре организмов.
Штаммы Escherichia coli, использованные в этом исследовании, были получены из коллекций Национальной референс-лаборатории E. coli (NRL E. coli) Федерального института оценки риска (BfR) в Берлине, Германия, ассоциированного французского Национального Референс-центра E. coli при педиатрической больнице Robert-Debré в Париже (Франция) и французского агентства по пищевым продуктам, окружающей среде и охране труда (Anses) в Мезон-Альфоре, Франция.
Большинство изученных здесь штаммов относятся к ранее описанным коллекциям (Wullenweber et al., 1993; Beutin et al., 2004, 2007, 2016; Bidet et al., 2007; Bugarel и соавт., 2010; Мартин и Beutin, 2011). Штаммы E. coli, используемые для проверки специфичности анализов qPCR, включали, в частности, референтные штаммы E. coli, принадлежащие к серогруппам O1-O186 и H-типам H1-H56. Штаммы E. coli, несущие капсульный антиген K1 (Орсков и Орсков, 1984; Wullenweber et al., 1993; Беттельхайм и др., 2003) были использованы в качестве референтных штаммов для специфической ПЦР гена neuB в реальном времени.