Научная литература
booksshare.net -> Добавить материал -> Биология -> Александров А.А. -> "Компьютерный анализ генетических текстов" -> 31

Компьютерный анализ генетических текстов - Александров А.А.

Александров А.А., Александров Н.Н., Бородовский М.Ю. Компьютерный анализ генетических текстов — М.:Наука , 1990. — 267 c.
ISBN 5-02-004691-4
Скачать (прямая ссылка): komputerniyanalizgeneticheskihtextov1990.djv
Предыдущая << 1 .. 25 26 27 28 29 30 < 31 > 32 33 34 35 36 37 .. 119 >> Следующая

4
(lom)
_ STRUCTURAL GENES REGION ***** *
---------Б=ЕЕСШЯ-------
wright * left
transcription* transcription *
P и c.2.8. Функция г для ДНК фага лямбда,сопоставленная с генетической картой и современными представлениями о модульной структуре фага лямбда
Положение пиков г обозначено крестиками хххх, а предполагаемые границы модулей - звездочками ****.
85 22
kil+cIII
b-REGION
А А A * * *
left transcription
SITE-
SPECIFIC RECOMBINATION ' S GENES
''GENES — WITH UNKNOWN FUNCTIONS
---GENERAL-----
RECOMBINATION ' S GENES +
kil,cIII,ral
rex
В
!rex! !с ! I ! I !_A_!II!I!I I _! с !
221
I
64
!S!RIRz!
! _l I___I
I
ell
68
IMMUNE
REGION
REPLICATION GENES +
nin-REGION
LATE GENES
4. Пик 6 - конец области сайт-специфической рекомбинации. Начало
области с неизвестными функциями.
5. Пик 7 - отделяют гены общей рекомбинации (ехо,с,у) и kil.cIII,
ral (функции неизвестны) от области иммунитета в широком смысле.
Остались нерассмотренными два пика 1 и 2. Пик 2 попадает внутрь гена J. Ген J фага лямбда контролирует два признака: реакцию фага на специфические инактивирующие антитела и специфичность адсорбции. В работах Крылова, Цыганкова и Диллона (Крылов, Цыганков,1976; Dhillon et al.,1982) получены результаты, позволяющие предположить, что способность белка J к связыванию инактивирущего антитела и специфичность адсорбции - два разделимых признака. Именно эти результаты, а также работа Шоу и др. (Shaw et al.,1977) привели к расширению модульной гипотезы до субгенного уровня (Крылов,1985). Таким образом, пик в области гена J может отражать наличие такого субгенного модуля.
Анализ пиков функции г позволяет в ряде случаев попытаться уточнить современные представления о модульной структуре фага лямбда. Так, например, в настоящее время неизвестно точное положение границы модуля структурных генов: до или после гена lom. Положение пика 3 (справа от lom) позволяет высказать предположение о том, что модуль структурных генов включает lom.Положение пика 5 (левая граница гена int) позволяет предположить, что линкерная последовательность между Ъ-областыо и генами сайт-специфической рекомбинации, локализована ближе к левой границе гена int.
Следует отметить, что при анализе функции г мы не имели теоретического обоснования для уровня порога, при котором пик можно рассматривать как значимый. Для "строгого" выбора порога необходимо оценивать параметры распределения "статистического расстояния" между генетическими текстами (Миронов и Александров,1988). Эта задача возникает при анализе алгоритмов "быстрого" поиска гомологий и является довольно сложной - в настоящее время предприняты лишь первые попытки ее решения (Певзнер,19886).
2.5. СТАТИСТИЧЕСКАЯ ЗНАЧИМОСТЬ ГОМОЛОГИЙ
Для анализа статистической значимости гомологий необходимо решить следующие вопросы:
- выбрать модель порождения генетического текста;
- определить понятие сходства (гомологии) генетических текстов;
- оценить статистические параметры распределения уровня гомологии в
рамках выбранной модели.
Модели порождения текстов и значимость гомологий. В первых работах по анализу статистической значимости гомологий использовалась простейшая модель: буквы в последовательностях X и Y порождаются независимо с вероятностями рд, рт, pG, рс для X и qA, qT, qG, qc для Y. Липман и др. (Lipman et al.,1984) впервые обратили внимание на неадекватность такого подхода в связи с некоторыми особенностями (асимметрия в распределении динуклеотидов (Nussinov, 1980а), А-сбло-ченность (Nussinov,1980b), АТ-богатые области (Moreau et al.,1982)) нуклеотидных последовательностей, не укладывающимися в рамки модели независимого появления букв.
Липман и др. (Lipman et al.,1984), выбрав 100 последовательностей из банка нуклеотидных последовательностей GENBANK, построили гистограмму распределения уровня гомологии (различные подходы к определению уровня гомологии рассматриваются в следующем разделе) и сравнили ее с гистограммами распределения уровня гомологии, построенными для трех различных моделей:
- случайное перемешивание с сохранением нуклеотидного состава;
- случайное перемешивание с сохранением динуклеотидного состава (Fitch,1983);
- случайное перемешивание с сохранением локального нуклеотидного состава.
Было показано, что вид гистограмм может значительно меняться в зависимости от типа рассматриваемой модели. Таким образом выводы о значимости гомологий могут существенно зависеть от модели порождения текста. В случаях, когда уровень сходства последовательностей оказывается значимым в одной модели и незначимым в другой, становится ясно, какие статистические свойства нуклеотидных последовательностей (например, динуклеотидная ассиметрия) привели к возникновению "ложной" гомологии.
Предыдущая << 1 .. 25 26 27 28 29 30 < 31 > 32 33 34 35 36 37 .. 119 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed