booksshare.net -> Добавить материал -> Биология -> Александров А.А. -> "Компьютерный анализ генетических текстов" -> 108

Компьютерный анализ генетических текстов - Александров А.А.

Александров А.А., Александров Н.Н., Бородовский М.Ю. Компьютерный анализ генетических текстов — М.:Наука , 1990. — 267 c.
ISBN 5-02-004691-4
Скачать (прямая ссылка): komputerniyanalizgeneticheskihtextov1990.djv

Предыдущая << 1 .. 102 103 104 105 106 107 < 108 > 109 110 111 112 113 114 .. 119 >> Следующая

ной ЭВМ, сопряженной с графической станцией, разработка высокоэффективных графических языков. Третье - новые методы анализа генетических текстов, включающих как новые алгоритмы анализа отдельных областей, так и автоматизацию моделирования сложных генетических систем, в которых анализ первичной структуры выступает лишь как один из уровней исследования. Четвертое - переход от отдельных молекулярно-генетических БД к интегрированным БД и, возможно, формирование на' основе этого баз знаний (Стогний, Глазунов,1986). Пятое - постоянная разработка концептуального интерфейса, т. е. гносеологических и соответствующих им "естественных" (т. е. того, что обычно сужается до понятия "общение на естественном языке") программных средств общения исследователей и программных комплексов. Шестое - разработка средств гибкого и эффективного управления гигантскими массивами информации. С этой проблемой неизбежно столкнутся коллективы, которые в настоящее время приступают к осуществлению проекта секвенирования генома человека, содержащего приблизительно 3 млрд пар нуклеотидов. Трудоемкость этого проекта оценивается в 150-2000-30 000 человеко-лет, а цена от 60 млн до 3 млрд долларов (Roberts 1987а,b). Однако первичная последовательность генома будет лежать мертвым грузом, если не будет средств работы с ним. Уолтер Гильберт, основавший компанию Genome Corporation, предполагает после завершения проекта по секвестрованию извлекать прибыль, обслуживая потребителей информации по человеческому геному. По-видимому, это перспективное дело.
Рис. 7.6. Пакет SEQBUS. Программа Q>STEM. Схема инвертированных повторов длиной 7 пар нуклеотидов на последовательности TFIIIA, разделенных не более чем 101 нуклеотидом. Выведены только совершенные повторы.
На схеме повторы показаны равнобедренными треугольниками, стороны которых соединяют два элемента повтора, а высота определяет значимость повтора в условных единицах. Повторы заданного типа, как видно из сравнения с рис.7.5, локализуются вблизи начала и конца структурной части гена TFIIIA
;«j - ‘'Vi i . 3E -03
... , 1 -I---------1---------1--------1--------1-----------*—;----»-
&-$t-40XX С O0001 -00400>В
Рис. 7.7. Пакет SEQBUS. Программа Q>REVN. Точечная матрица гомологии между фрагментами 1-400 последовательности SV40XX
Параметры фильтрации: точка ставится на матрице, если совпадают 6 нуклеотидов из 7. 1,3*10-3 - ожидаемая плотность точек на матрице. Хорошо виден повтор длиной 72 пары нуклеотидов, а также серия более мелких повторов вблизи начала последовательности
Приложение А
Таблица кодирования нуклеотидов, включая вырожденные
Основные нуклеотиды
Обозначение Английское Русское
название название
А Adenine Аденин
С Cytosine Цитозин
G Guanine Гуанин
Т Thymine Тимин
и Uraci1 Урацил
Знаки, кодирующие набор нуклеотидов

Обозначение Набор Название
R (A, G) Пурин (Purine)
Y (С,T/U) Пиримидин (Pyrimidine)
М (А,С)
W (A,T/U)
S (C.G)
к (G, Т)
D (A.G.T/U)
Н (А,С,T/U)
V (A,C,G)
В (C.G, T/U)
N (А,С,G,T/U)*
(пробел) Нет никакого нуклеотида
‘Иногда этот набор обозначается знаком минус. Знак минус используется также в базах данных в тех случаях, когда неизвестно, какой нуклеотид стоит в данном положении.
ЛИТЕРАТУРА
Адельсон-Вельский Г.М., Диниц Е.А., Карзанов А.В. Потоковые алгоритмы. М.: Наука,1975.119с.
Александров А.А., Голованов Е.И., Сприжицкий Ю.А. Основные функции пакетов прикладных программ анализа нуклеотидных и аминокислотных последовательностей//Теоретические исследования и банки данных по молекулярной биологии и генетике. Новосибирск,1986. С.61-64.
Александров Н.Н., Миронов А.А. Распознавание промоторов Escherichia coli по первичной структуре ДНК//Молекуляр. биология. 1987. Т. 20. С.242-249.
Анев П.Д., Василева В.И., Матеева Ж.Ц. Интерактивная информационно-поисковая система ПОИСК-1.2. Часть первая. Описание применения. М. :МЦНТИ, 1982. 32 с.
Бородовский М.Ю..Миронов А.А..Певзнер П.А. О значимости встречаемости слов в непрерывных текстах с учетом самопересечений//Математи-ческие и вычислительные методы в биологии. Биомолекулярные системы. Пущино,1987.С.67-63.
Бородовский М.Ю., Сприжицкий Ю.А., Голованов Е.И., Александров А.А. Статистические закономерности в первичных структурах функциональных областей генома E.coli 1.Частотные характеристики//Молекуляр. биология.1986а.Т.20.С.1014-1023.

Предыдущая << 1 .. 102 103 104 105 106 107 < 108 > 109 110 111 112 113 114 .. 119 >> Следующая