Научная литература
booksshare.net -> Добавить материал -> Физика -> Гоппа В.Д. -> "Введение в Алгебраическую теорию информации" -> 26

Введение в Алгебраическую теорию информации - Гоппа В.Д.

Гоппа В.Д. Введение в Алгебраическую теорию информации — М.: Наука, 1995. — 112 c.
Скачать (прямая ссылка): vvedenievalgebraicheskuu1995.pdf
Предыдущая << 1 .. 20 21 22 23 24 25 < 26 > 27 28 29 30 .. 31 >> Следующая

определенных стадиях развития:
1
10 11 12 13 14 15
Таким образом, один ген может кодировать несколько различных белков.
Синтез молекул РНК начинается в определенных местах ДНК, называемыми
промоторами, и завершается в терминаторах. Участок ДНК, ограниченный
промоторЬм и терминатором, представляет собой единицу транскрипции-
оперон. В пределах каждого оперона копируется только одна из двух нитей
ДНК, которая называется значащей или матричной. Во всех оперонах,
считываемых в одном направлении, значащей является одна нить ДНК. В
оперонах, считываемых в противоположном направлении, значащей является
другая нить ДНК. Соседние опероны могут быть отделены друг от друга
нетранскрибируемыми участками ДНК, а могут и перекрываться. Разбиение ДНК
на множество оперонов обеспечивает возможность независимого считывания
разных генов, их индивидуального включения и выключения. Транскрипция
осуществляется специальным ферментом-РНК- полимеразой.
5.6. Генетический код
После того как на стадии транскрипции сформирована цепочка букв РНК:
AUGGUUCGUUC ...,
наступает этап превращения этого слова в последовательность белков
(стадия трансляции).
Белки играют важнейшую роль в жизнедеятельности любых организмов.
Некоторые белки являются ферментами, т.е. катализаторами биохимических
реакций в живых организмах. Без участия ферментов подобные реакции не
происходят или протекают слишком медленно. Другие белки (структурные)
выполняют в организме роль строительных блоков. Некоторые белки, такие,
например, как гемоглобин, участвуют в системе запасания и транспорта
кислорода.
Белки-это большие полимерные молекулы, построенные из аминокислотных
звеньев. В состав белков входят 20 различных видов аминокислот:
Глицин (Gly), Аланин (Ala), Валин (Val) и
95
др. Таким образом, каждый белок представляет собой слово в 20-буквенном
алфавите:
Met - Gin - Arg - Туг - Glu - Ser - Leu -...
В процессе трансляции происходит перевод четырех буквенного слова в 20-
буквенное слово:
AUG GUU CGU ...
1 1 1
Met Val Arg
Сразу после того, как была признана модель строения ДНК, многие
исследователи сосредоточили свое внимание на установлении истинной
природы генетического кода. Было ясно, что, поскольку в состав белков
входят 20 различных аминокислот, каждый кодон (набор букв, кодирующий
аминокислоту), должен состоять не менее чем из трех нуклеотидов. Дублеты
могли бы образовать не более 16 различных кодонов, в то время как на
основе триплетов можно составить до 64 различных кодонов.
Можно представить себе несколько способов построения
триплетного кода. Код мог бы быть перекрывающимся:
U
U
и
Возникла красивая гипотеза кода без запятой, обеспечивающего
синхронизацию нуклеотидной последовательности (Ф. Крик).
С. Голомб предложил следующую формализацию.
Пусть Ап обозначает множество слов длины п в алфавите А из q букв.
Рассмотрим два слова х, у е Ап:
х - (aj, ..., йл),
>-=(*!>-, Ъп).
Соединяя эти слова последовательно:
flj, а2, ..., ап, ij, b2, ..., Ьп, получаем п - 1 новых слов:
(а2, ••., ап, ij),
(а3> •••> ^i> ^2)'
(ап' Ьп-2> Ъп_{),
которые называются перекрытиями слов д: и у.
96
Подмножество D С Ап называют кодом без запятой, если для любых двух
кодовых слов х, у G D все перекрытия не являются кодовыми словами. Такой
код обеспечивает синхронизацию в длинной цепочке кодовых слов.
Действительно, выберем некоторую букву такой цепочки в качестве стартовой
позиции, отсчитаем п букв, в результате получим некоторое
слово из Ап. Если мы попали в перекрытие, то это слово не будет кодовым
(предполагается, что перед нашими глазами, точнее, перед глазами
рибосомы, осуществляющей трансляцию, выписан весь кодовый словарь D ).
Сдвигаемся влево на одну позицию и повторяем процедуру до тех пор, пока
не получим кодовое слово. Тем самым будет установлена правильная
стартовая позиция.
Какова может быть максимальная мощность кода I D\ (обозначим ее W (?)>?
Простая оценка сверху может быть получена из рассмотрения периода слова.
Пусть Т^х обозначает, как и прежде, циклический сдвиг на к шагов.
Минимальное число к, при
котором Т^х = х,. назовем периодом d слова х. Ясно, что d < п и d
является делителем числа п. Слова максимального периода d = п назовем
основными. Код без запятой может содержать лишь основные слова.
Действительно, пусть х-слово периода d < п. Выписывая подряд это слово
два раза, получаем перекрытие, совпадающее со словом х:
Если обозначить через Р (у) число основных слов из q букв, то получим
оценку
(циклический сдвиг кодового слова не может быть кодовым словом).
Очевидно,
Из этого равенства можно получить выражение для ^(<?)>
используя формулу обращения Мёбиуса.
Пусть Дп), F(n)- две целочисленные функции натурального аргумента, причем
а Ь с а Ъ с. .а b с а b
И
и
х
d\n
d\n
97
Тогда
/(") =2 № F(n,d)' din
где функция Мёбиуса определяется следующим образом:
если (1 = 1,
если <1 делится на квадрат, (-1/, если d = pv ..., pr.
H{d) =
Отсюда получаем
Предыдущая << 1 .. 20 21 22 23 24 25 < 26 > 27 28 29 30 .. 31 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed