Научная литература
booksshare.net -> Добавить материал -> Биология -> Эбилинг В. -> "Физика процессов эволюции" -> 149

Физика процессов эволюции - Эбилинг В.

Эбилинг В., Энгель А., Файстель Р. Физика процессов эволюции — М.: УРСС, 2001. — 342 c.
Скачать (прямая ссылка): fizikaprocessovevolucii2001.djvu
Предыдущая << 1 .. 143 144 145 146 147 148 < 149 > 150 151 152 153 154 155 .. 176 >> Следующая

Следующий уровень в языке НК образуют цистроны. Цистрон представляет собой ориентированную последовательность кодонов. Каждый цистрон начинается с открывающего (начального) символа АУГ или ГУГ и заканчивается завершающим символом УАА, УАГ или УГА. Цистроны служат единицами перевода; они соответствуют фрагментам мРНК и полипептидов.
Следующий уровень образуют скриптоны, служащие единицами транскрипции. Скриптон всегда начинается с промотора и завершается терминатором транскрип-
ции. Скриптоны, как правило, состоят из нескольких (до десяти) цистронов, знаков препинания и неактивных эдементов.
Следующий уровень образуют репликоны. Репликон — единица репликации. Каждый репликон представляет собой последовательность нуклеотидов, ограниченную старт- и стоп-символом, или промотором и терминатором, репликации. Как правило, репликоны состоят из нескольких (до 1000) скриптонов, а также знаков препинания и других функциональных единиц.
У организмов, размножающихся половым путем, существует еще уровень се-грегонов. Сегрегон представляет собой нить нуклеотидов, служащих единицами при редукционном делении — так называемом мейозе.
Наконец, высший уровень языка НК образуют геномы. Геном представляет собой совокупность наследственной информации клетки, хранящейся в последовательностях нуклеотидов.
Язык ПП. Все осмысленные конструкции этого языка построены над алфавитом из 20 аминокислот. В языке ПП нет знаков препинания, поскольку не существует информационного процесса, в котором материальные носители языка ПП служили бы матрицами. Особенность языка ПП состоит в том, что его материальные носители не только кодируют сообщение, но и доставляют его «адресату». Значение осмысленных конструкций языка ПП задается ПП-кодом. Под ПП-кодом мы понимаем набор правил, выражающих взаимосвязь между последовательностью аминокислот и функцией соответствующего белка. Правила эти, если не считать редких исключений, пока не известны. Однако не приходится сомневаться в том, что соответствие между последовательностью аминокислот и биологической функцией белка действительно существует. В целом о языке ПП известно гораздо меньше, чем о языке НК.
Фундаментальные математические основы формальной лингвистики были заложены в работах Хомского (Хомский, 1962; Chomsky, 1966, 1972). Хомский исходит из понятия грамматики. Под грамматикой он понимает систему правил, позволяющих породить из данного алфавита некоторое множество предложений. Хомский устанавливает иерархию грамматик. Простеший класс охватывает регулярные грамматики, в свою очередь порождающие регулярные языки. В основе регулярных грамматик Лежат правила, порождающие предложения в результате последовательности принятия решений о выборе элементов алфавита по порядку слева направо. Иначе говоря, сначала мы выбираем первый, самый левый элемент (символ), а каждый последующий элемент определяется характером предшествующего элемента. Простым примером служит правила: за А следует Ц, за Ц следует Г, за Г следует Т, за Т следует А. Они порождают предложения
ГТАЦГТАЦГТАЦГТАЦ....
Регулярные языки могут быть определены с помощью конечных автоматов (Gossel, 1972). Хомский показал, что некоторые языки нерегулярны, например, предложения с зеркальной симметрией типа
АГГА, АТЦТТЦТА
не могут быть порождены регулярными грамматиками. На этом основании Хомский ввел более обширные классы структурных грамматик, при этом различая контекстносвободные и контекстносенситивные грамматики.
Уточним введенные выше понятия с помощью следующих определений (Linden-тауег, 1971).
Определение 1. Алфавитом X называется конечное множество символов: {Ai, А2,..., Ах}. В случае ДНК X = {А,Ц,Г,Т}, в случае РНК X — {А,Ц,Г,У} и в случае
белка X = {А, С, D,..., Y, W} (А = 20). Множество всех конечных последовательностей (слов), которые можно построить из алфавита, обозначается X* (свободная полугруппа слов над X). Пустая последовательность е также считается принадлежащей X*. Множество последовательностей без е обозначается Х+.
Определение 2. Языком над алфавитом X называется подмножество свободной полугруппы X*.
Определение 3. Если р и q из X*, то их композиция pq (конкатенация) есть снова слово из X*.
Определение 4. Структурной грамматикой называется упорядочная четверка G = {N,T,P,S}, где
1) N — конечное множество переменных (вспомогательный алфавит), называемых нетерминальными; к их числу принадлежит старт-символ S;
2) Т — конечное множество, Т & X, элементов, называемых терминальными;
3) Р — конечное множество порождающих правил р —> q.
Определение 5. Контекстносенситивной грамматикой называется система правил вида paq -* pyq, р, q € Т*, а € N, у е (JV U Т)+.
Контекстносвободной грамматикой называется система правил вида а —* р,
«т е N ир е (jv и ту.
Регулярной грамматикой называется система правил вида а —» х или а —* xq, <7,х€ N и q?T или q = е.
Определение б. Языком, порожденным грамматикой G, называется множество всех последовательностей, состоящих только из терминальных символов и порождаемых из старт-символа в результате поочередного применения конечного числа порождающих правил. В зависимости от характера порождающей грамматики язык называется регулярным, контекстносвободным или контекстносенситивным.
Предыдущая << 1 .. 143 144 145 146 147 148 < 149 > 150 151 152 153 154 155 .. 176 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed