Институт естествознания и экономики
Кафедра общей биологии, экологии и методики обучения
РЕФЕРАТ
ПО ДИСЦИПЛИНЕ
БИОИНФОРМАТИКА
«МЕТОДЫ, ИСПОЛЬЗУЮЩИЕСЯ БИОИНФОРМАТИКОЙ ДЛЯ АНАЛИЗА МАКРОМОЛЕКУЛ И СОЗДАНИЯ ЛЕКАРСТВ»
Направление подготовки: 050100.62 педагогическое образование
Профиль подготовки: Биология
Форма обучения: Заочная
Выполнили студентки:
Горбова Д.А.
Андреева Н.А.
группа 503(2)-Б ОЗО
Проверил:
проф. Сафонов М.А.
_____________________
дата подпись
«___»__________2017 г.
Оренбург, 2017 г.
Оглавление
1. Введение………………………………………………………………..3
2. Список сокращений……………………………………………………4
3. Анализ геномов – что можно извлечь из генетических текстов…...5
4. От последовательности – к структуре и функции………………….8
5. От структуры – к механизмам функционирования макромолекул..13
6. От структуры и функции макромолекул к лекарствам……………..13
7. Заключение…………………………………………………………….17
8. Список литературы…………………………………………………....18
Введение
Под биоинформатикой понимают любое использование компьютеров для обработки биологической информации. На практике, иногда это определение более узкое, под ним понимают использование компьютеров для обработки экспериментальных данных по структуре биологических макромолекул (белков и нуклеиновых кислот) с целью получения биологически значимой информации. Впоследствии поле термина «биоинформатика» расширилось и включает все реализации математических алгоритмов, связанных с биологическими объектами.
Считается, что не всякое использование вычислительных методов в биологии является биоинформатикой, например, математическое моделирование биологических процессов — это не биоинформатика.
|
Биоинформатика использует методы прикладной математики, статистики и информатики. Исследования в вычислительной биологии нередко пересекаются с системной биологией. Основные усилия исследователей в этой области направлены на изучение геномов, анализ и предсказание структуры белков, анализ и предсказание взаимодействий молекул белка друг с другом и другими молекулами, а также реконструкция эволюции. Все это используется для формализации представлений о структуре и принципах функционирования живых объектов.
Наряду с применением уже созданных методов биоинформатики интенсивно развивается техническая и программная база. Работы, связанные с биоинформатикой требуют серьезной компьютерной поддержки, эффективной обработки больших массивов разнообразных данных из многочисленных источников, быстрого проведения многочисленных расчетов и визуализации получаемых результатов в реальном времени.
Список сокращений
БП – белки прародители
БД – база данных
3D – пространственная структура
Анализ геномов – что можно извлечь из генетических текстов
К настоящему времени полностью расшифрованы геномы около 30 биологических видов. В ближайшие годы ожидается завершение работ по анализу геномов еще несколько десятков видов, среди них – геномы ряда патогенных микроорганизмов; микроорганизмов, находящих применение в биотехнологии; геномов млекопитающих, в том числе – человека.
|
Информация о геномах указанных видов предоставлена для свободного доступа на Web-серверах ряда организаций, которые занимаются собственно расшифровкой геномов (например, The Sanger Centre, Wellcome Trust, Великобритания; The Institute of Genomic Research, США), хранением и систематизацией медико-биологической и биотехнологической информации (например, National Center for Biotechnology Information, США), ее компьютерным анализом, а также активно использующих такую информацию в прикладных и фундаментальных исследованиях (например, Institut Pasteur, Франция).
Базы данных (БД) геномов содержат нуклеотидные последовательности и "транслированные" по ним аминокислотные последовательности белков. В большинстве БД также содержатся дополнительные данные, как экспериментальные (например, значимость гена для выживаемости организма), так и полученные расчетным путем (например, функция белка, кодируемого геном, может быть постулирована на основе сходства его аминокислотной последовательности с первичной структурой уже охарактеризованного белка).
Web-серверы, предоставляющие пользователю генетическую информацию, оснащены комплексом программных средств для поиска в БД и анализа нуклеотидных и аминокислотных последовательностей. В качестве запросов при поиске последовательностей в БД могут использоваться номенклатурные названия генов, организмов, ключевые слова и др.
Ядро любой генетической информационной системы составляет программа поиска в БД гомологов последовательности, заданной пользователем. Обычно используются программы BLAST или FastA. Кроме того, на Web-серверах представлены программные средства, позволяющие рассчитать некоторые физико-химические свойства белка (например, изоэлектрическую точку), предсказывать вторичную структуру, наличие и локализацию трансмембранных участков и т.д. Такие данные часто используются при выполнении широкого круга исследований.
|
Перечисленные программные средства позволяют ориентировочно установить некоторые характеристики отдельного выбранного белка. Вместе с тем, возможности выполнения операций с группами последовательностей как правило, ограничены, что не позволяет осуществлять сравнительный анализ целых геномов или больших групп последовательностей. Это ограничение значительно затрудняет решение с использованием этих программных средств задач по прогнозированию структурно-функциональных взаимосвязей для групп белков и поиску потенциальных молекулярных мишеней лекарственных препаратов на основе сравнительного анализа генетической информации.
После определения последовательности генома необходимо выделить в его составе отдельные гены. Задача включает в себя определение локализации отдельных генов в нуклеотидной последовательности и идентификацию их границ и решается с применением методов биоинформатики. Эти методы позволяют определить с высокой степенью вероятности, является ли ген интроном или экзоном, а также является ли ген структурным или регуляторным. Используемые для этого подходы основаны на сравнении изучаемого генома с геномами, охарактеризованными ранее. Для локализации генов наилучшие результаты дает комбинация методов определения открытых рамок считывания и различий в частоте использования кодонов.
Когда "разметка" генома выполнена, осуществляется функциональная классификация отдельных генов. Задача решается путем поиска последовательностей, гомологичных рассматриваемому гену, в базах данных ранее охарактеризованных генов и белков. Таким образом, функция нового гена прогнозируется, исходя из функции гомологов. Далее, путем выравнивания исследуемой последовательности с ее гомологами можно выявить в ней мотивы, ответственные за функцию белка, например - формирующие активный центр фермента. Сопоставлением групп последовательностей можно обнаружить, какие белки образуют функциональные комплексы, в реализации каких метаболических путей они принимают участие.
На следующем этапе осуществляют поиск новых потенциальных мишеней для действия лекарственных средств. Проблема поиска мишеней встала особенно остро в связи с ситуацией, сложившейся в области создания новых противомикробных средств. Во многих случаях возможности воздействия лекарств на известные белки-мишени - практически исчерпаны (как например, в случаях ВИЧ, вирусов гриппа, микобактерий туберкулеза и др.). Это обусловило необходимость поиска новых молекулярных мишеней для лекарств. С другой стороны, применение современных эффективных подходов к созданию новых лекарственных препаратов требует детального изучения потенциальной молекулярной мишени. При создании нового противомикробного средства необходимо также учитывать его возможный спектр действия и вероятные побочные эффекты. Перечисленные факторы создают предпосылки для использования генетической информации при выборе мишеней для действия противомикробных средств.
В 1999 году была опубликована первая работа, описывающая попытку выбора мишеней для действия лекарственных средств на основании сравнительного анализа генетической информации. Программа CATS была разработана с целью автоматизации выбора молекулярных мишеней для поиска новых противогрибковых средств. Вместе с тем, авторы преследовали цель создать достаточно гибкую систему, которая могла бы быть также использована применительно к другим фармакологическим группам.
Программа CATS предназначена для анализа геномов с целью поиска белков, которые могли бы рассматриваться как наиболее предпочтительные мишени для действия лекарственных веществ. В качестве входной информации программа использует аминокислотные последовательности, соответствующие генам рассматриваемого микроорганизма, сравнниваемых геномов и сопутствующую информацию.
Такой подход позволяет автоматизировать выбор потенциальных мишеней и определить приоритеты более детального изучения каждой из них, что сокращает число рассматриваемых объектов с нескольких тысяч до десятков.
Подход к конструированию лекарств на основе биоинформатики носит комплексный характер: уже на стадии анализа генетических текстов (сравнительный анализ целых геномов, отдельных генов) приходится принимать во внимание известную на конкретный момент информацию о структуре и функции ряда белков из различных организмов, возможности создания метода тестирования, возможности построения модели 3D структуры выбранной мишени, и ряд других факторов.