Научная литература
booksshare.net -> Добавить материал -> Биология -> Александров А.А. -> "Компьютерный анализ генетических текстов" -> 40

Компьютерный анализ генетических текстов - Александров А.А.

Александров А.А., Александров Н.Н., Бородовский М.Ю. Компьютерный анализ генетических текстов — М.:Наука , 1990. — 267 c.
ISBN 5-02-004691-4
Скачать (прямая ссылка): komputerniyanalizgeneticheskihtextov1990.djv
Предыдущая << 1 .. 34 35 36 37 38 39 < 40 > 41 42 43 44 45 46 .. 119 >> Следующая

Из вышесказанного ясно, что каждый из этих способов опирался на простые представления о структуре кодирующих последовательностей, вытекающие из свойств таблицы генетического кода, и не требовал специального предварительного статистического анализа известных кодирующих областей.
RNY-закономерности. В работе Шефферда (Shepherd,1981) для определения рамки считывания в кодирующей области были впервые использованы результаты анализа статистических характеристик белок-кодирующих
Рис. 3.1. Частоты встречаемости комбинаций YR(N)kYY в первичной структуре ДНК .
а - для ФХ174; б - для кластера генов рибосомных белков E.coli; в -для гистоновых генов морского ежа
последовательностей ДНК. Материалом для предварительного анализа послужили расшифрованные в 19?8г. геномы вирусов ФХ174, G4, fd, SV4C,
MS2, ДНК плазмиды pBR322, гены рибосомальных белков E.coli и гистоно-вые гены морского ежа. На постановку задачи существенно повлиял контакт автора с М.Эйгеном, который активно разрабатывал проблему возникновения генетического кода (Eigen,19?8). Поэтому цель работы была тесно связана с проверкой гипотезы Эйгена о происхождении современного генетического кода от архаического кодового правила, в соответствии с которым первичная структура кодирующего участка ДНК должна была состоять из периодически повторяющихся триплетов RNY RNY RNY...RNY... (R-пурин,Y-пиримидин).
Использовалась весьма простая техника статистического анализа. Последовательность ДНК записывалась в алфавите R,Y. Затем определялись численности "разнесенных" на к позиций динуклеотидов YR- -YY. Например, если величина промежутка составляла К нуклеотидов, то такой тетрануклеотид записывается как YR(N)kYY. Из результатов, представленных на рис.3.1, видно, что встречаемость пар YY увеличивается периодически через 0,3,6 и т.д. оснований после пары YR. Выраженность этой закономерности убывает в ряду: вирусы, прокариоты, эукариоты.
все е
3 Г а I---1 I-1 I-1 1-----1
К 11 Н
-----1 I---------1
LII
L1
2000
но иг
?000
2000
нз
то
HZB
пч
HZA Н1 V—ч
о
2000
то
Рис. 3.2. Предсказание кодирующих рамок в первичных для разных организмов
а - вирусы; б - прокариоты; в - эукариоты
:труктурах ДНК
Основанный на этом наблюдении метод предсказания заключается в следующем.. Берется фрагмент последовательности ДНК определенной длины (например, 62 нуклеотида) и записывается в коде - R,Y. Затем фрагмент анализируется в трех возможных рамках считывания: в первой рамке - от позиции 1 до позиции 60, во второй рамке - от 2 до 61, в третьей рамке
- от 3 до 62. В каждом случае подсчитывается число замен (мутаций) R в
Y и Y и R, необходимых для того, чтобы представить R.Y-текст в виде серии триплетов RNY. Записывается номер рамки, которому соответствует минимальное число замен. Для анализа длинной последовательности
ее разбивают на непересекающиеся фрагменты и поочередно анализируют их, отмечая номер рамки как функцию на графике в центре каждого фрагмента (рис. 3.2).
Ясно, что метод симметричен относительно инвертирования последовательности. Таким образом, если отсутсвует априорная информация, тс остается неопределенность, по какой из нитей ДНК считывается генетическая информация в найденной рамке.
Работа Шефферда интересна в нескольких отношениях. Во-первых, она, как и работа Шульмана, использует достаточно простую модель кодирующей области, но выбору модели предшествует статистический анализ известных кодирующих областей, совокупность которых можно было бы рассматривать как обучающую выборку. Заметим, однако, что мы считаем нецелесообразным использовать здесь понятие обучающей выборки, так как полученная модель имеет универсальный характер и не зависит от таксономической группы природной ДНК, взятой для исследования. Во-вторых, весьма важной является попытка глубокого эволюционного и биологического обоснования модели.
Работа Шефферда, конечно, не была лишена недостатков. На наш взгляд, более соответствовало бы постановке задачи исследование встречаемости тетрануклеотидов YR(N)kYR и доказательство, что имеется периодическое увеличение их численности при к=1,4,? (ср. рис.3.1). Не было строго показано, что отклонения частот встречаемости тетрануклеотидоз YR(N)kYY от ожидаемых величин являются статистически значимыми. Кроме того, контрольный пример, демонстрирующий визуализацию белок-коди-рующих областей ряда ДНК (см. рис.3.2), сам по себе не дает информации
Предыдущая << 1 .. 34 35 36 37 38 39 < 40 > 41 42 43 44 45 46 .. 119 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed