Научная литература
booksshare.net -> Добавить материал -> Биология -> Соловьев В.В. -> "Использование ЭВМ в молекулярной биологии. Введение в теорию генетических текстов" -> 15

Использование ЭВМ в молекулярной биологии. Введение в теорию генетических текстов - Соловьев В.В.

Соловьев В.В. Использование ЭВМ в молекулярной биологии. Введение в теорию генетических текстов — Новосибирск, 1988. — 93 c.
Скачать (прямая ссылка): ispolzovanieevmvmolekulyarnoy1988.djvu
Предыдущая << 1 .. 9 10 11 12 13 14 < 15 > 16 17 18 19 20 21 .. 30 >> Следующая

Для всего этого, вслед за Гэтлином Д07/, авторы вводят две меры избыточности текстов:
Л1- Нтак~ Н ; 1)Д-Н-Нт«) , (?)
где Н wax = 1оьть - максимальная энтропия буквы ГТ;
Н - энтропия текста, полученная по формуле (1 ); H^d) - условная энтропия пар оснований, которая вычисляется по формуле ( 3 ) .
Как отмечают авторы, Ж (избыточность первого порядка)
45
показывает отклонение от максимальной энтропии, обусловленное неравномерностью состава нуклеотидов; J2 (избыточность второго порядка) показывает отклонение от независимости соседних нуклеотидов в тексте.
Несложно понять, что мера избыточности Шенона /III/, учитывающая только парные связи между элементами, выражается через две рассматриваемые авторами меры: (jd1 + Dz)/В.
Используя меру D2, Липман и соавт. /115/ проанализировали несколько симуляционных моделей генетических текстов. Первая модель строилась следующим образом. В реальной кодирующей последовательности случайным образом заменялись все кодоны на синонимичные, т.е. принадлежащие той же кодовой серии. В результате получали случайные последовательности, кодирующие тот же белок, что и реальная последовательность. Во второй модели кодоны заменялись только на те синонимичные им кодоны, которые встречались в реальной последовательности. Таким образом сохранялся исходный кодонный состав последовательности. В последней модели замена синонимичных кодонов цроводилась с учетом соседних оснований слева и справа от третьего основания в кодоне.
В результате делается вывод о том, что при переходе от митохондриальных генов к црокариотическим, а затем к эукариотическим возрастает зависимость третьего нуклеотида в кодонах от соседних нуклеотидов справа и слева /109/.
3.2.5. Внутренняя повтопенность ГТ. Другим источником избыточности ГТ является наличие в них внутренней повторенное™, дублирования информации. Наиболее характерным свойством таких повторов в ГТ является наличие большого числа различий между повторенными участками. Существует несколько методов для поиска различных периодичностей в полинуклеотидных и аминокислотных последовательностях /116 - 120/.
Для быстрого анализа Дуркин Д16/ предложил использовать автокорреляционную функцию Р(п ), оцределяемую для нуклеотидной последовательности (Aj, Ag, ... А^), как
«
в противном случае .
46
Фактически Р(л/) измеряет частоту расположения одинаковых динуклеотидов на расстоянии tv друг от друга. Эта автокорреляционная функция позволила обнаружить определенные закономерности в расположении динуклеотидов в генах» кодирующие глобулярные белки с регулярной вторично структурой /Н6, 117/.
Для обнаружения периодичностей в ГТ цримеияют также дискретный Фурье анализ (гармонический анализ) /118 - 120/.
Б частности» в работах Ричерта и др. /П8/, Фурлонга и др. /П9/ на его основе анализируется так называемая информативность ?Т (seti-in-formaiion) элемента текста. В первом случае Sl=-losp^ , где - частота встречаемости j-й аминокислоты в исследуемом полипептидном тексте /118/. Б работах Фурлонга /119/ вычисляется информативность динуклеотида. При этом учитывается его связь с четырьмя соседними динуклеотида-ми слева и справа по тексту. Информативность динуклеотида, стоящего в позиции \ ,
Здесь гк+777 гк - пара динуклеотидов, один из которых находится в позиции к , а другой в позиции к + m (например, в позиции Тс стоит динуклеотид АТ, а в позиции к+ ш -
тельности таких пар, отстоящих друг от друга на m нуклеотидов (аналогично для Р ™ „ ).
X* д”— 777 X /с
В работе /143/ поиск периодичностей на основе преобразования Фурье проводился следующим образом. Вычислялся гармонический коэффициент
где j -период колебаний. Максимум этого коэффициента достигается при таком периоде j , который соответствует регулярным интервалам вдоль последовательности, имеющим сходные по величине информативности. С помощью этого метода проведено исследование генома фага ФХ174 и обнаружена четкая периодичность
-ес ); Р
тп
ТК + тпгк
- частота встречаемости в последова-
47
в информативности динуклеотидов, отстоящих друг от друга на три позиции. Кроме того, обнаруживаются менее выраженные периоды через 12,20 и 24 нуклеотида.
Для выяснения природы наблюдаемой периодичности через три нуклеотида авторы цровели тест на рэндомизацшо (случайное перемешивание) различных позиций в кодонах. Оказалось, что периодичность исчезает только при одновременной рэндомизации I-й и 3-й позиций всех кодонов в последовательности. После перемешивания кодонов между собой в последовательности также теряется указанная периодичность. Это говорит о неслучайном расположении динуклеотидов в ГТ, которое,по-видимому, связано с неслучайным расположением кодонов в последовательности /119/.
3.2.7. Помехоустойчивость. Избыточность ГТ уменьшает количество информации, потенциально содержащейся в них. Однако одновременно она снижает вероятность искажения информации и повышает помехоустойчивость ГТ в процессах передачи генетической информации. Заметим, что цри передаче ГИ от родителей к потомкам (цри репликации ДНК) шуадом, искажающим первоначальную информацию,является фон случайных мутаций /121/. Специфика биологических объектов заключается в том, что в процессе эволюции ГТ может возникать новая информация (цри "запоминании" отобранных либо случайных мутаций) /ИЗ/.
Предыдущая << 1 .. 9 10 11 12 13 14 < 15 > 16 17 18 19 20 21 .. 30 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed