Научная литература
booksshare.net -> Добавить материал -> Биология -> Эбилинг В. -> "Физика процессов эволюции" -> 138

Физика процессов эволюции - Эбилинг В.

Эбилинг В., Энгель А., Файстель Р. Физика процессов эволюции — М.: УРСС, 2001. — 342 c.
Скачать (прямая ссылка): fizikaprocessovevolucii2001.djvu
Предыдущая << 1 .. 132 133 134 135 136 137 < 138 > 139 140 141 142 143 144 .. 176 >> Следующая

Отличительная особенность физики состоит в исследовании величин, допускающих количественное описание. Соответственно, физика эволюции должна интересоваться измеримостью информации. Мерой информации служит информационная емкость запоминающего устройства (памяти), задаваемая логарифмом числа различных возможных состояний памяти. Однако эта величина ничего не говорит о степени загруженности памяти информацией. Такие меры, как информационная (шенноновская) энтропия или сложность последовательности символов, позволяют судить о доле емкости запоминающего устройства сверх минимально необходимой для хранения информации по отношению к доле минимально необходимой емкости (избыточность).
Наконец, гораздо труднее ответить на вопрос, какой ценностью обладает определенная информация для перерабатывающей ее системы, например, для живого существа. Этот вопрос затрагивает семантику и поэтому выходит за рамки чисто синтаксических исследований. Но в качестве первого приближения для оценки содержания информации можно воспользоваться синтаксическими мерами, поскольку информационное содержание высокоизбыточного сообщения заведомо не может быть максимальным.
Таким образом, мы в праве ожидать, что генетические последовательности символов должны обладать относительно высокой сложностью. С другой стороны, генотипическая информация представляет собой программу построения живых существ, длина которой была оптимизирована в процессе отбора. Из опыта работы с компьютерами нам известно, что, используя языки программирования, мы можем сократить программу и записать ее в более удобном для хранения в запоминающем устройстве виде. Если мы хотим применить те же методы к генетическому программированию, то прежде всего необходимо предположить существование определенных грамматических правил. Но наличие каких-то правил или закономерностей в последовательности символов означает уменьшение сложности; по-видимому, генетическая информация обладает не максимальной, а «почти» максимальной сложностью.
Альтернативная концепция «ценности информации» была предложена Воль-кенштейном (1978, 1979, 1984, 1986). По Волькенштейну, ценность информации определяется биологическим значением замены имеющихся носителей информации (последовательности) любыми другими носителями. В качестве конкретной меры Волькенштейн предлагает, например, для кодона сумму средних различий гидрофобий кодированных аминокислот, которые возникали бы при замене отдельных нуклеотидов в кодоне. Под гидрофобией здесь понимается изменение свободной энергии при переводе аминокислоты из спирта в воду. В отличие от сложности эта мера информации ориентирована на семантику и поэтому определена лишь для специальных (в данном случае генетических) носителей информации.
Рассмотрим произвольную цепь молекул сортов {А|, Аг,..., Ад} суммарной длины V. Пусть
— множество различных последовательностей. Число элементов этого множества (кардинальное число) равно А". Множество всех последовательностей длины v ^ ш,
элементов. Ясно, что множество всех последовательностей произвольной длины (ш —*¦ оо), которое мы обозначим X*, счетно и бесконечно. Для исследования биопоследовательностей с успехом применяются методы теории кодирования, используемые при передаче сообщений. Несколько примеров эффективности такого подхода уже существует (Иваницкий и др., 1978; Ebeling, Feistel, Jimdnez-Montano, 1977; Ebeling, Mahnke, 1979). В смысле теории кодирования мы будем называть элементы последовательности р* буквами, множество X = {А|, А2,..., Ал} — алфавитом и последовательности {Р)Р2 ¦ ¦ - pv} — словами, или молекулярными словами. Слово в дальнейшем мы будем обозначать одной буквой, например, р = {Р1Р2 ¦ ¦ ¦ р„}. Пустое слово условимся обозначать буквой е. Каждой последовательности р различными способами можно поставить в соответствие некоторое натуральное число д(р). Оно называется гёделевским числом (последовательности р).
Гёделевские числа порождают взаимнооднозначное отображение множества последовательностей (слов) на множество натуральных чисел, т. е. для каждой последовательности р существует ровно одно натуральное число д(р), и для каждого натурального числа п существует ровно одно слово р = д~[(п). Для данного слова длины v над алфавитом {Ai,..., Ад}
Множество всех слов X* над алфавитом X = {А| ... Ад} с операцией умножения
образует полугруппу — так называемую полугруппу слов.
Наконец, важно подчеркнуть, что множество всех слов X* метризуемо. Проблема метрики на кодированных молекулярных последовательностях была впервые рассмотрена Бейером, Штейном, Смитом и Уламом (Beyer, Stein, Smith, Ulam, 1974), а позднее и рядом других авторов (Sankoff, 1975; Ebeling, Feistel, Jimenez-Montano, 1977). В рамках теории кодирования расстояние между последовательностями равной
-Г" : = {PiP2 • • - P* I Р* € X = {А,, А2)..., Ад}}
(11.10)
которое мы обозначим Х^т\ содержит
(11.11)
{z.-.zi,. . . Z,„}
Предыдущая << 1 .. 132 133 134 135 136 137 < 138 > 139 140 141 142 143 144 .. 176 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed