Научная литература
booksshare.net -> Добавить материал -> Биология -> Александров А.А. -> "Компьютерный анализ генетических текстов" -> 99

Компьютерный анализ генетических текстов - Александров А.А.

Александров А.А., Александров Н.Н., Бородовский М.Ю. Компьютерный анализ генетических текстов — М.:Наука , 1990. — 267 c.
ISBN 5-02-004691-4
Скачать (прямая ссылка): komputerniyanalizgeneticheskihtextov1990.djv
Предыдущая << 1 .. 93 94 95 96 97 98 < 99 > 100 101 102 103 104 105 .. 119 >> Следующая

ПАКЕТЫ ПРИКЛАДНЫХ ПРОГРАММ АНАЛИЗА НУКЛЕОТИДНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
Цель этой главы обозначить те вопросы, с которыми столкнется человек. который захочет практически приступить к работе на ЭВМ с генетическими текстами, используя те представления к методы, которые были изложены в предыдущих главах. Для более полного ознакомления с вопросами, которые рассматриваются здесь, рекомендуется обратиться к компьютерным выпускам журнала Nucleic Acids Research (1582. Vol. Ю, No 1; 1984. Vol. 12, No 1; 1986. Vol.14. No 1). вышедшими также отдельными книгами под редакцией D.Soli, R.J.Roberts, и книге "Nucleic acid and protein sequence analysis: a practical approach" под редакцией M,J.Bishop, С.Rawlings, 1987.
Весьма полезным является представление об информационно-вычислительном комплексе как о совокупности иерархически подчиненных уровней, начиная от материаловедения и физики полупроводников до предметной области конкретной науки. Предмет данной главы - отображение предметной области молекулярной биологии и генетики на вычислительную среду.
7.1. АППАРАТНОЕ ОБЕСПЕЧЕНИЕ. ТИПЫ ЭВМ. ТИПЫ ВНЕШНИХ НОСИТЕЛЕЙ ИНФОРМАЦИИ
Для эффективной работы с большими массивами молекулярно-генетической информации необходимы компьютеры. Традиционно выделяется несколько типов ЭВМ (Громов,1984): микро-ЭВМ. мини-ЭВМ, большие ЭВМ.
супер ЭВМ.
Эти типы выделяются по мошносги вычислительных ресурсов ЭВМ. Прежде всего они отличаются по объему оперативной памяти. Объем памяти ЭВМ является не единственной характеристикой, определяющей мощность машины. Важным параметром является также разрядность и количество основных регистров, разрядность шины, быстродействие и др. Все эти характеристики в реальных ЭВМ взаимосвязаны. Чем больше объем памяти, тем больше необходимая разрядность регистров для эффективной работы и т.д. С развитием вычислительной техники, ее совер-
шенствованием и удешевлением условные границы между соседними классами ЭВМ смещаются в сторону более высоких значений.
Появление персональных компьютеров придало новый характер процессу информационно-вычислительного общения исследователей с ЭВМ. Вначале персональные компьютеры были 8-разрядными вычислительными машинами (например, Apple II), в настоящее время в подавляющем большинстве они имеют 16-разрядные центральные процессоры. Появились образцы 32-разрядных персональных ЭВМ, по своей мощности превосходящие мини-ЭВМ недавнего прошлого.
Для долговременного хранения информации используются внешние носители. Основными их типами являются магнитные диски с емкостью 2Мбайт-1Гбайт, магнитные ленты с емкостью 20Мбайт-1Гбайт, гибкие магнитные дискеты с емкостью 128Кбайт-1,2Мбайт. На персональных компьютерах получили распространение встроенные (несъемные) магнитные диски типа "винчестер" с емкостью 5-120 Мбайт.
Различают внешние устройства прямого и последовательного доступа. Накопители, использующие диски и гибкие дискеты, являются устройствами прямого доступа, т. е. в них возможен непосредственный доступ к физической записи с заданным адресом N без необходимости просмотра всех промежуточных записей. В ленточных накопителях, в том числе кассетных, для доступа к записи с адресом N необходимо промотать ленту с текущего положения головки до этой записи. Поэтому случайный поиск на магнитной ленте требует много времени. В связи с зтим для доступа к базам данных информация с лент обычно переписывается на магнитные диски.
Из числа других периферийных устройств следует отметить печатающие устройства (принтеры). Наиболее часто используются принтеры с лепестковым шрифтоносителем ("ромашкой") и матричные принтеры, в которых отпечаток литеры формируется при помощи иголочек. Они имеют скорость печати 50-300 знаков в 1 мин. При помощи матричных принтеров можно печатать и графическую информацию. Для вычерчивания графиков используются графопостроители различных типов.
7.2. МОЛЕКУЛЯРНО-ГЕНЕТИЧЕСКИЕ БАЗЫ ДАННЫХ
Что такое "база данных"? Базу данных (БД) можно представить себе как упорядоченный .набор данных, записанный на каком-либо носителе. Данное - это число, логическая константа (типа "да" или "нет"), либо фрагмент текста, имеющего смысл в данной БД. В реальных БД упорядоченность может быть самой разнообразной в зависимости от предметной области. Под выше приведенное определение попадает большой контингент записанных знаний. Например, текст любой книги может служить примером БД, так как внутри себя этот текст определенным обра-
зом упорядочен. Для чего используется БД? Элементарный ответ - для выдачи данного. Понятно, что из произвольного текста довольно трудно извлечь необходимое данное, даже если оно там содержится б явном виде. Дело в том, что художественное или научное сочинение как источник неформализовако и неформатировано.
Большую степень упорядоченности представляет собой постатейный текст энциклопедий, справочников. Однако под БД обычно интуитивно понимают высоко упорядоченный набор данных так, что можно говорить о "формате" БД, т. е. о том, какая именно информация и в каких именно позициях строки записана на носителе. Часто БД является набором отдельных записей, каждая запись относится к одному объекту реального мира. Иногда запись (в особенности в библиографических БД) называют вторичным документом в отличие от первичных документов, в которых описываются реальные объекты. Разные стороны объектов описываются в разных разделах записи, называемых полями. Записи сопоставляется
Предыдущая << 1 .. 93 94 95 96 97 98 < 99 > 100 101 102 103 104 105 .. 119 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed