Научная литература
booksshare.net -> Добавить материал -> Биология -> Александров А.А. -> "Компьютерный анализ генетических текстов" -> 58

Компьютерный анализ генетических текстов - Александров А.А.

Александров А.А., Александров Н.Н., Бородовский М.Ю. Компьютерный анализ генетических текстов — М.:Наука , 1990. — 267 c.
ISBN 5-02-004691-4
Скачать (прямая ссылка): komputerniyanalizgeneticheskihtextov1990.djv
Предыдущая << 1 .. 52 53 54 55 56 57 < 58 > 59 60 61 62 63 64 .. 119 >> Следующая

В случае отдельных нуклеотидов-признаков матрица штрафов/премий в ряде работ формировалась на основании матрицы частот встречаемости нуклеотидов (Golovanov et al., 1982; Harr et al., 1983; Mulligan et al., 1984; Staden, 1984b; Grob, Stuber, 1988). Выдвигались различные способы вычисленения вклада конкретных нуклеотидов в дискриминирующее число, однако все методы отличались нюансами масштабирования и давали в целом сходные результаты. Наибольший резонанс получила работа Маллигана и соавт. (Mulligan et al., 1984), в которой была показана корреляция между гомологическим индексом (homology score) и функциональной активностью промоторов in vitro. Вклад каждой позиции в гомологический индекс считался пропорциональным разнице между частотой встречаемости данного и наиболее часто встречаемого нуклеотида и нормировался на ожидаемое по статистике среднеквадратичное отклонение. Стаден (Staden, 1984b) использовал другую формулу (элемент матрицы весов у него пропорционален логарифму частоты встречаемости нуклеотида, что эквивалентно случаю STATSITE), однако, по свидетельству Мак-Клура (McClure, 1985), корреляция активности промоторов со значением распознающей функции, подсчитанным по методу Стадена, имеет тот же порядок, что и полученная в работе Маллигана. Таким образом, на основании сравнения с экспериментом ни один из способов заполнения матриц не получил неоспоримого преимущества.
Функциональные сигналы и статистическая механика. В 1987 г. Берг и Фон Хиппель (Berg, von Hippel, 1987, 1988), исследовали вопрос о том, какой формулой нужно пользоваться при вычислении элементов матрицы штрафов/премий по матрице частот встречаемости нуклеотидов. Авторы рассмотрели процесс ДНК-белкового связывания с точки зрения статистической механики и показали, что при ряде предположений вклад нуклеотида в дискриминирующее число можно оценить теоретически. Были сделаны следующие предположения.
1. Селекция индивидуальных белок-связывающих последовательностей происходит таким образом, что энергия связывания находится в некотором "полезном" для системы диапазоне значений. В зависимости от функциональной роли рассматриваемого ДНК-белкового взаимодействия этот Диапазон может заметно варьировать от сайта к сайту.
2. Число последовательностей в указанном диапазоне энергий связывания, которые в принципе могут быть использованы, велико. Если селекция происходит только на основе энергии связывания, мутационный "нейтральный дрейф" последовательности в рамках этого селекционного ограничения обеспечивает то, что все последовательности равновероятны.
5 Заказ N” 4327 . OQ
3. Каждое возможное основание b в позиции 1 вносит вклад Е1ЬкТ в свободную энергию связывания с этим сайтом. Вклады отдельных пар оснований предполагаются независимыми и потому аддитивными. Номер наиболее сильно связывающего нуклеотида (пары) обозначим заглавной буквой В; он задает нулевой энергетический уровень Е1В=0.
Таким образом, Е1Ь-это положительные числа, характеризующие уменьшение свободной энергии связывания (в единицах кТ) в том случае, когда наиболее сильно связывающий нуклеотид в положении 1 заменяется на нуклеотид Ь. Авторы назвали эту величину "локальной энергией различения".
В этих предположениях наиболее сильно связывающая пара оказывается наиболее часто встречающейся, и вообще по частоте встречи можнс приблизительно определить энергию различения. Формула для оценки энергий различения, выведенная Бергом и Фон Хиппелем, выглядит следующим образом:
п,в+1
Е1Ь= Ш(-^-) . (4.5)
п.,+1
где п1В - это число встреч наиболее часто встречавшейся пары в позиции 1; п1Ь - число встречаемости пары Ь. Энергия различения последовательности в целом вычисляется как сумма энергий различения отдельных нуклеотидов.
Формула (4.5) задает способ вычисления (аддитивного) штрафа в весовой матрице на основании матрицы позиционных частот встречаемости. Формулы заполнения весовой матрицы, предложенные Харром (Harr et al., 1983), Маллиганом (Mulligan et al., 1984) и Стаденом (Staden, 1984b), могут быть получены из формулы (4.5) путем пренебрежения малыми членами и добавлением постоянных.
Описанный выше подход ведет к предположению, что последовательность, составленная из наиболее вероятных нуклеотидов, окажется наиболее сильным функциональным сигналом. Несколько последовательностей, близких к наиболее вероятной для промотора, были синтезированы и испытаны на транскрипционную активность. Оказалось, что статистически "хороший" промотор обладает достаточно высокой функциональной активностью как in vivo, так и in vitro (McClure, 1985). Среди природных последовательностей промоторов E.coli не известно такой, у которой одновременно имеются канонические -10 и -35 боксы, что свидетельствует о том, что клетка не максимизирует промоторную активность. Возможно, что оптимизация функциональных сигналов идет по пути, предположенном Бергом и Фон Хиппелем, - по пути минимизации влияния мутаций на функциональную активность.
Предыдущая << 1 .. 52 53 54 55 56 57 < 58 > 59 60 61 62 63 64 .. 119 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed