Научная литература
booksshare.net -> Добавить материал -> Биология -> Александров А.А. -> "Компьютерный анализ генетических текстов" -> 69

Компьютерный анализ генетических текстов - Александров А.А.

Александров А.А., Александров Н.Н., Бородовский М.Ю. Компьютерный анализ генетических текстов — М.:Наука , 1990. — 267 c.
ISBN 5-02-004691-4
Скачать (прямая ссылка): komputerniyanalizgeneticheskihtextov1990.djv
Предыдущая << 1 .. 63 64 65 66 67 68 < 69 > 70 71 72 73 74 75 .. 119 >> Следующая

Решить задачу распознавания функциональных сайтов означает найти общие для выборки сайтов особенности, при этом может отсутствовать информация о точной привязке сайта к последовательности. Казалось, первое, что нужно сделать - это выровнять выборку с тем, чтобы похожие участки оказались друг под другом. Но что есть сходство? На примере терминаторов мы видели, что при выравнивании важно принимать ес внимание не только конкретные нуклеотиды, но и вторичную структуру молекулы.
Значит, сначала нужно определить набор признаков, из которого можно составить модель любого функционального сайта. Но даже если нам и удастся определить характерные признаки для выборки сайтов, выровнять ее все равно нельзя: мы ничего не знаем о вкладе признаков в выполнение функции, т.е. о весе признаков. Определить вес признака (параметры модели) можно лишь только по выровненной выборке. Круг замкнулся.
Как объединить решения этих задач для распознавания сайтов, пока не ясно. В последнее время начинается развитие систем, позволяющих легко конструировать модели функциональных сигналов (Staden, 1988) на основании нескольких известных и заложенных в программу типов признаков. Однако возможно, что придется отказаться от простого соединения разработанных алгоритмов и придумать что-нибудь совершенно новое.
Глава 5. ФИЗИЧЕСКОЕ (РЕСТРИКЦИОННОЕ) КАРТИРОВАНИЕ МОЛЕКУЛ ДНК
5.1.КАК ПОСТРОИТЬ ФИЗИЧЕСКУЮ КАРТУ?
Зачем нужны физические карты? В 1970 г. Гамильтон Смит обнаружил, что специальный фермент - рестриктаза Hindi I разрезает молекулы ДНК при встрече последовательностей из шести нуклеотидов GTGCAC или GTTAAC. Вскоре после этого была построена(Баппа et al.,1973) первая физическая карта (рис.5.1) - изображение молекулы ДНК с указанием мест разреза рестриктазами(сайтов). С тех пор физические карты стали
Р и с.5.1. Физическая карта генома SV40, построенная в 1973 г. К.Дэйна, К.Сэком и Д.Натансом
Стрелками показаны места разрезов генома ферментом, выделенным из Н.influenzae
одним из основных инструментов исследования в молекулярной генетике. После построения физической карты SV40 Д.Натане сумел точно указать место инициации репликации, затем физическая карта была использована для картирования белок-кодирующих областей SV40. Клонирование до сих пор остается основной областью применения физических карт. После появления методов чтения последовательностей ДНК сфера использования физического картирования значительно расширилась: построение физи-
ческой карты обычно предшествует проведению работ по секвенированию. Следует также отметить, что физические карты активно применяются для выявления эволюционнной близости геномов (Templeton,1983; Waterman et al.,1984; Helm-Bychowski,Wilson,1986) и определения специфичности рестриктаз(Мазанов,Киселев,1986). Различным аспектам применения физических карт посвящена книга "Statistical analysis of DNA sequences data",1983.
Широкое использование физических карт требует развития биохими-
ческих и математических методов, позволяющих строить карты с довольно большим числом сайтов (на такой "подробной" физической карте можно точнее локализовать гены). Однако, несмотря на то, что задача физического картирования была включена еще в первый проект по компьютерной генетике MOLGEN (Stefic, 1978), ее до сих пор нельзя считать окончательно решенной. Дело в том, что при большом числе сайтов построение физической карты требует перебора и анализа огромного количества гипотез о порядке расположения рестрикционных фрагментов -решение этой задачи возможно только при использовании современных методов дискретной оптимизации.
Конечно, зная нуклеотидную последовательность, легко построить физическую карту по каждой рестриктазе - для этого нужно просто найти все вхождения сайта узнавания этой рестриктазы в последовательность ДНК. Однако, если последовательность ДНК неизвестна (или известна не полностью), то физическое картирование превращается в довольно трудоемкую процедуру, требующую как проведения биохимических экспериментов, так и применения специальных математических методов построения физических карт по косвенным биохимическим данным. При этом размеры фрагментов определяются с помощью биохимических методов, а вот восстановление порядка расположения фрагментов требует привлечения методов дискретной оптимизации и ЭВМ.
Как получают физические карты? Стандартная биохимическая процедура - электрофорез - позволяет (с некоторой точностью) определить длины рестрикционных фрагментов, однако для построения физической карты требуется также знать порядок расположения этих фрагментов. Так, например, для фага SM Pseudomonas aeruginosa, имеющего всего 3 сайта узнавания рестриктазы HindiII,возможны 24 различных варианта расположения фрагментов, некоторые из них представлены на рис.5.2. В начале 70-х годов возникла идея восстановления порядка расположения фрагментов на физической карте, основанная на использовании данных о совместной рестрикции по двум рестриктазам.
На рис.5.3 схематически изображена электрофореграмма, полученная после обработки линейной ДНК фага SM Pseudomonas aeruginosa рестрик-тазами HindiII ( 4 фрагмента),BamHI (3 фрагмента) и совместной обработки рестриктазами Hindi II и BamHI (6 фрагментов, при совместной обработке молекула ДНК расщепляется как по сайтам HindiII, таг и по сайтам BamHI). В табл. 5.1 представлены размеры фрагментов,полученных при обработке рестриктазами HindiII,BamHI и HindiII+BamHI(размеры определены на основании анализа злектрофореграммы). Можно рассмотреть 4!=24 гипотез о порядке расположения фрагментов рестриктазы HindiII и 31=6 гипотез о порядке расположения фрагментов рестриктазы BamHI: таким образом, возможны 144 варианта взаимного расположения
Предыдущая << 1 .. 63 64 65 66 67 68 < 69 > 70 71 72 73 74 75 .. 119 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed