Научная литература
booksshare.net -> Добавить материал -> Химия -> Кинг Р. -> "Химические приложения топологии и теории графов " -> 205

Химические приложения топологии и теории графов - Кинг Р.

Кинг Р. Химические приложения топологии и теории графов — М.: Мир, 1987. — 560 c.
Скачать (прямая ссылка): himicheskieprilojeniya1987.djvu
Предыдущая << 1 .. 199 200 201 202 203 204 < 205 > 206 207 208 209 210 211 .. 216 >> Следующая

фрагментов. Предварительный анализ подтверждает эту идею. Рассмотрим
молекулу из М атомов, которая была частично разбуга на фрагменты.
Распознаны фрагменты из F и G атомов. Из М(А/ - 1)/2 расстояний F(F -
1)/2 + G(G - 1)/2 известны как "свойства" фрагментов. Допустим наличие
третьего фрагмента Я, имеющего р общих атомов с фрагментом F и q общих
атомов с фрагментом G. Из Я(Я - 1)/2 расстояний, соответствующих
фрагменту Я, р(р -
- 1) + q(q - 1)/2 являются лишними, а Я(Я - 1) - р(р - 1) -
- q(q - 1)/2 - новыми. Если, как часто случается, р + q = Н,
Программа на языке лисп-
535
РИС I Множество расстояний определяется частично F-атомным фрагментом и
частично G-атомным фрагментом Перекрывающийся фрагмент с р атомами,
общими с F, и q атомами, общими с G, определяет pq новых расстояний.
то число новых расстояний увеличивается на pq; оптимальное расположение
перекрывающихся фрагментов - половина в F, половина в G. Полное число
известных расстояний в трех фрагментах равно F(F - 1)/2 + G(G - 1)/2 +
(Я/2)(Я/2 - 1)/2. Доля всех известных расстояний в молекуле из 10 атомов,
разложенной на два пятиатомных фрагмента, равна 40/90; если фрагмент,
содержащий Я атомов, перекрывается оптимальным образом, то это число
равно 80 + Я(Я - 2)/180. Очевидно, что чем больше величина Я, тем лучше:
если Я = 6, то доля известных расстояний возрастает от 0,444 до 0,578.
Для того чтобы получить нЬвую информацию, есть смысл иметь немного лишних
данных.
Мы хотели подражать способам, с помощью которых человек - вероятно,
наилучший распознаватель двумерных образов - рассматривает структурную
формулу, поскольку даже мимолетный взгляд на структурную формулу дает
огромное количество информации/ закодированной в компактной и доступной
форме. Взгляд на структурную формулу, такую, как структурная формула
блеоми-цина (рис. 2) *, "напоминает" нам: 1) вероятную величину
большинства длин основных связей с точностью в пределах 0,05 А;
2) вероятные основные валентные углы с точностью в пределах 5°;
3) суммарные характеристики (цис, транс или гвш) торсионных углов.
Реакционные центры и возможные реакции у каждого центра также возникают в
памяти почти непроизвольно. Наилучшее компьютерное представление должно
делать во многом то же самое - в форме, которая может быть использована
для предоставления информации другим программам. Мы следовали кое в чем
карикатуре уловок "технологии знания", разработанной Фейгенбау-мом при
его попытках выделить и закодировать методы, с по-
* Блеомнцин - противоопухолевый антибиотик, тормозящий включение тимн-
дина в ДНК н угнетающий рост опухолевых клеток - Прим перев
536
К. Триндл, Р. Гиван
V"*"
Lb].
РИС. 2. Область блеомицина В2, связывающая ДНК.
Эта обычная для химиков схема пробуждает у них предс гавление о
геометрии, реакционной способности и стабильности молекулы.
мощью которых специалисты-химики идентифицируют структуры по данным масс-
спектрометрии и ЯМР-спектроскопии. Эти усилия, нашедшие выражение в
"экспертной системе" DENDRAL, явились, по-видимому, первым убедительным
доказательством того, что исследования в области искусственного
интеллекта всегда будут давать результаты, имеющие широкое применение.
Однако такой подход приводит к некоторым "сюрреалистическим дискуссиям",
в ходе которых вы спрашиваете: "Но откуда вам известно, что существует
цикл?". Эти задачи достаточно иллюзорны, следовательно, мы не можем
претендовать на какое-либо основательное соответствие между нашими и
"человеческими" методами. Наш алгоритм является гибридом этих подходов,
естественных и эффективных либо для языка лисп, либо для людей, но редко
и для тех и других.
При первом рассмотрении задачи разбиения молекулы на значимые фрагменты
очень поверхностный взгляд бросается на каждый известный фрагмент и
немедленно исключаются любые фрагменты, которые ни в коем случае не могут
присутствовать в молекуле. Проверка осуществляется функцией SUBSET; атомы
во фрагментах должны иметь аналоги в молекуле, у которых такое же имя
NAME. На этой довольно поверхностной первой стадии отвергаются многие
кандидаты, но требуется определенно "нечеловеческое" и, вероятно,
дорогостоящее исследование каждой записи в большом банке данных о
фрагментах. Люди, напротив, сосредоточивают внимание на частях молекулы и
разыскивают соответствия об-
Программа на языке лисп
537
разцу в очень малом множестве фрагментов-кандидатов. О том" каким образом
выполняется первый отбор, мы не имеем ясного представления.
Затем уцелевших после первого отбора мы подвергаем другому, несколько
более глубокому тесту. Для каждого атома во фрагменте мы восстанавливаем
множество его соседей (список NEIGHBOR). Это множество должно быть
подмножеством (функция SUBSET) множества соседей (список NEIGHBOR)
некоторого атома в молекуле с тем же самым именем NAME. На самом деле
этому условию могут удовлетворять несколько атомов в молекуле, и мы
должны проследить за всеми положениями в молекуле, где могут быть атомы
Предыдущая << 1 .. 199 200 201 202 203 204 < 205 > 206 207 208 209 210 211 .. 216 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed