Научная литература
booksshare.net -> Добавить материал -> Физика -> Гоппа В.Д. -> "Введение в Алгебраическую теорию информации" -> 27

Введение в Алгебраическую теорию информации - Гоппа В.Д.

Гоппа В.Д. Введение в Алгебраическую теорию информации — М.: Наука, 1995. — 112 c.
Скачать (прямая ссылка): vvedenievalgebraicheskuu1995.pdf
Предыдущая << 1 .. 21 22 23 24 25 26 < 27 > 28 29 30 .. 31 >> Следующая

1,
О,
w = 2 vnld'
d\n
так что
W №Qn,d-
d\n
Подставляя n - 3, q = 4, получаем
W3(4) < | (Ml) ' 43 + A(3) • 4) = i(43 - 4) = 20.
Оказывается, при n = 3 и любом q полученная оценка для Wn(q) является
достижимой: следует выбирать кодовые слова
(abc) по правилу а < b > с. Действительно, рассмотрим пару кодовых слов:
abcdef. Тут выполняются неравенства
а < Ъ > с,
d < е > /.
Первое перекрытие bed не является кодовым словом, потому что b > с.
Второе перекрытие cde не является кодовым словом, потому что d < е. Таким
образом, мы действительно получили код без запятой. Период слова может
быть равен или 1, или 3. Основные слова-это слова, в которых встречаются
хотя бы две разные буквы.
Легко показать, что сдвигом основного слова всегда можно получить слово,
удовлетворяющее условию а < b > с. В то же время слова вида (ааа), bbb),
... не входят в код. Поэтому мощность кода в точности равна (t?3 - q)!3.
Таким образом, из 64 возможных слов можно было бы создать код из 20 слов,
обеспечивающий синхронизацию. Однако природа не пошла по этому пути и,
как всегда, оказалась права: ошибка хотя бы в одном символе (нуклеотиде)
приводила бы к нарушению синхронизации и вела бы к летальному для
организма исходу.
В результате тончайших биохимических экспериментов, проведенных Ф.
Криком, М. Ниренбергом, С. Очоа, Г. Кораной 98
было установлено, что генетический код является неперекрываю-щимся, и был
установлен смысл каждого кодона. Расшифровка генетического кода,
полностью завершенная в 1966 г., явилась величайшим научным достижением.
Окончательная таблица выглядит следующим образом:
и С A G
и иии иис UUA UUG Phe Leu иси исс UCA UCG ¦Ser иАи\туг UAC у
UAA) UAG\P UGU] r " UGc\} UGA Stop UGG Trp U С A G
с сии CUC CUA CUG Leu сси ССС ССА CCG Pro CAU CAC CAA CAG ¦His
Giln CGU CGC CGA CGG ¦Arg U С A G
А AUU AUC AUA AUG1 •lie Vet ACU АСС АСА ACG Thr AAU AAC AAA AAG
Asn ¦Lys AGU AGC AGA AGG .Ser Arg U С A G
G GUU GUC GUA GUG Val GCU GCC GCA GCG Ala GAU) . GAc\ P GAA}".
gag] lu GGU GGC GGA GGG ¦Gly U С A G
Как следует из таблицы, код является вырожденным, т.е. существуют слова-
синонимы: GUU = GUC = Val, CGG = AGA ~
= Arg и т. д. Имеются три кодона: UAA, UAG, UGA, которые не несут
смысловой нагрузки (non-sence). Они являются терминатор-ными кодонами:
появление такого кодона в слове означает конец трансляции. Если такой
кодон возникает в результате изменения какой-либо буквы смыслового кодона
(мутации), это приводит обычно к летальному исходу.
Пожалуй, самой впечатляющей особенностью генетического кода является его
универсальность. Приведенную таблицу можно с одинаковым успехом применить
для расшифровки РНК человека, птицы, бактерии или табака. Из этого
правила, как выяснилось в 1979 г., есть исключения: генетический
код
митохондрий (особых органов клетки) характеризуется отличными от обычных
значениями некоторых кодонов и некоторыми особыми правилами узнавания
кодонов.
Трансляцию осуществляет особый орган клетки-рибосома. Синхронизация
(установка рамки считывания) осуществляется с помощью префикса, AGGAGGU,
который называется последовательностью Шайн-Долгарно. Искажение этой
последовательности приводит, конечно, к катастрофическим последствиям.
Однако эта последовательность присутствует в слове в единственном числе.
Поэтому вероятность искажения символов в определенных семи позициях
достаточно мала.
99
5.7. Хромосомная база данных
Каждый ген кодирует некоторый белок, который в свою очередь определяет
некоторый простой признак организма. При описании базы данных в гjf. 3
каждому признаку ставился в соответствие домен признака-то множество
значений, которое может принимать данный признак. В биологии понятие
домена эквивалентно понятию аллели. Каждый простой признак (ген) может
существовать в одной или нескольких альтернативных формах (аллелях).
Например, в каждом растении гороха существует ген, влияющий на форму
семян: семена могут быть гладкими или морщинистыми. Известно большое
число множественного аллелизма. Классический пример-ген, определяющий
окраску меха кролика. Здесь возможны по крайней мере четыре аллеля:
шиншиловый, дикий тип, гималайский, альбинос.
Для хранения генетической информации во всех живых организмах
используется реляционная база данных.
Каждое отношение У?(А'1, ..., X п) состоит из двух строк
(гомологичных хромосом). Хромосома содержит гены Х^ ..., Хп,
которые образуют сложный признак X. Пара хромосом образуется при
размножении: одна хромосома получается от отца, другая- от матери
(диплоидная пара). У гомологичных хромосом все гены совпадают по своей
функции, но могут отличаться несколькими нуклеотидами. Часто эти
изменения вызваны нежелательной мутацией и проявляются в форме
наследственного заболевания. Например, если в гене человека, кодирующем
гемоглобин, заменить букву Т на букву А в одной позиции, то возникает
альтернативная форма гемоглобина, ведущая к так называемой серповидной
Предыдущая << 1 .. 21 22 23 24 25 26 < 27 > 28 29 30 .. 31 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed