booksshare.net -> Добавить материал -> Биология -> Александров А.А. -> "Компьютерный анализ генетических текстов" -> 4

Компьютерный анализ генетических текстов - Александров А.А.

Александров А.А., Александров Н.Н., Бородовский М.Ю. Компьютерный анализ генетических текстов — М.:Наука , 1990. — 267 c.
ISBN 5-02-004691-4
Скачать (прямая ссылка): komputerniyanalizgeneticheskihtextov1990.djv

Предыдущая << 1 .. 2 3 < 4 > 5 6 7 8 9 10 .. 119 >> Следующая

В банке в доступном для пользователя виде хранится каждая расшифрованная последовательность и ее паспорт, в котором указаны различные сведения о ней. Это сведения об организме, из которого выделена последовательность, о документе, где она описана, о расположении на ней регуляторных участков и белках, которые она коди-
рует и т.д. В настоящее время созданы три большие базы данных последовательностей нуклеиновых кислот: "Genbank" (Лос-Аламос, США -более 30 млн. нуклеотидов), база данных нуклеотидных последовательностей Европейской молекулярно-биоло гической лаборатории (EMBL, Гейдельберг, ФРГ - более 30 млн. нуклеотидов) и 'Тенэксп-ресс" (СССР, ВИНИТИ-ИМГ АН СССР - более 11 млн. нуклеотидов). Известны также несколько белковых баз данных, наиболее представительной из которой является NBRF-PIR (США). Эти базы данных распространяются на различных носителях - магнитных лентах и дисках, на оптических дисках.
Производство баз данных и их интенсивное заполнение началось в середине 8С-х годов и развивается очень интенсивно. Объем баз данных удваивается каждые три года. Однако в погоне за полнотой составители баз данных проявляют недостаточное внимание к качеству и содержанию еводимой в базы данных информации. Принципы построения баз данных генетических текстов являются предметом горячих дискуссий. Яснс, что в ЭВМ нужно вводить как можно больше информации, но биологическую информацию трудно формализовть. Этим определяется тенденция к дифференциации баз данных. Например, в СССР кроме баз данных первичных структур нуклеиновых кислот и белков намечаются к выпуску базы данных векторов для генной инженерии, функциональных сигналов нуклеиновых кислот, ферментов, метаболических путей, генетических карт,
В то же время исследователю для решения биологических задач нужна одновременно самая разнообразная информация о генетике, биосинтезе и функционировании различных продуктов, а также библиографические сведения. Это приводит к необходимости создания интегрированных систем молекулярно-биологической информации, включающих все элементарные базы данных и связи между ними. Такие системы создаются в качестве опытных разработок и пока не распространяются на коммерческой основе. Таким образом, в банках данных в настоящее время накоплено и находится в доступном для пользователя виде огромное количество информации о последовательностях биополимеров.
Активному внедрению методов компьютерного анализа в молекулярную биологию существенно способствовал прогресс в вычислительной технике и математическом обеспечении последних двух десятилетий. Как раз к началу периода массового секвенирования (к концу 70-х годов) уже были ясны основные концепции формирования баз данных, которые как раз в это время начали широко применяться в области точных наук и деловой сфере.
Для работы с базой данных ЭВМ должна быть снабжена специальным комплексом программ СУБД (системой управления базой данных), последняя позволяет проводить разнообразные действия с документами базы данных: осуществлять поиск нужных документов по многим пара-
метрам, выделять информационные подбазы по определенным признакам, каталогизировать данные и т.д. В 80-х годах в мире создано несколько крупных систем для работы с несколькими базами данных структур биополимеров. Эти комплексы создавались на мощных ЭВМ и, несомненно, имеют большие возможности. Однако на крупных компьютерных системах выполняется сравнительно небольшое число работ разведочного характера.
Это во многом связано с психологией исследователей-биологов. Если физики давно привыкли работать в вычислительных центрах и знают, что без компьютеров им не обойтись, то некоторые биологи предпочитают считать нуклеотиды вручную, не обращаясь в вычислительный центр.
Биологам крупно повезло, что как раз к моменту возникновения необходимости обрабатывать последовательности с помощью ЭВМ на свет появились первые персональные компьютеры. Они стали важным инструментом в молекулярно-биологических лабораториях прежде всего потому, что на них очень удобно иметь локальные библиотеки последовательностей и других данных. Ресурса персональных ЭВМ вполне хватает для выполнения самих необходимых операций над последовательностями, эти ЭВМ стоят прямо в лабораториях и для них не нужно ни дополнительного персонала, ни дополнительных помещений. Дру жественное общение" персональной ЭВМ с пользователем часто приводит к тому, что непрофессионалы приобщаются к программированию и благодаря хорошему знанию своей предметной области создают ценные программные продукты.
Таким образом, подавляющее большинство расшифрованных последе вательностей анализируется в настоящее время на персональных компьютерах. Конечно, не все программы, необходимые для работы мо лекулярных биологов эффективны на персональных компьютерах. Прог раммы, требующие больших вычислений, рационально использовать на мощных ЭВМ. К ним относятся программы поиска гомологичных последовательностей во всем банке, выравнивание последовательностей, построение вторичных структур РНК, программы, связанные с энергетическими и термодинамическими расчетами и т.д.

Предыдущая << 1 .. 2 3 < 4 > 5 6 7 8 9 10 .. 119 >> Следующая