Научная литература
booksshare.net -> Добавить материал -> Химия -> Кинг Р. -> "Химические приложения топологии и теории графов " -> 206

Химические приложения топологии и теории графов - Кинг Р.

Кинг Р. Химические приложения топологии и теории графов — М.: Мир, 1987. — 560 c.
Скачать (прямая ссылка): himicheskieprilojeniya1987.djvu
Предыдущая << 1 .. 200 201 202 203 204 205 < 206 > 207 208 209 210 211 212 .. 216 >> Следующая

фрагмента. Мы должны хранить эти атомы как свойство * атома фрагмента -
свойство LOCI. Этот тест также удаляет много фрагментов, прошедших первый
тест.
Для последнего прохождения сокращенного таким образом списка фрагментов
необходимо применить наиболее сложный тест. Для каждого соседа (NEIGHBOR)
атома во фрагменте должен быть атом, имеющий в своем списке LOCI в
качестве соседа (NEIGHBOR) атом в списке LOCI исходного атома.
Кодирование этого условия (которое кажется не совсем понятным лишь из-за
неясности слов) в языке лисп является менее простым, чем осуществление
первых двух тестов. Оно достаточно сложное, так что будет полезно
привести пример.
Мы рассмотрим очень небольшую задачу, такую, что каждая стадия процесса
может быть описана в явном виде. Рассмотрим молекулу М, изображенную на
рис. 3; показаны также некоторые из фрагментов, которые будут сохранены
после первых двух отборов. Мы рассмотрим два фрагмента, представляющие
собой некоторые трудности вследствие эквивалентности симметрии (F1) или в
силу некоторых возможных ассоциаций, которые перекрываются (F2). Списки
LOCI для каждого атома во фрагментах заключаются в кавычки. Наша
программа тестирует каждый атом фрагмента. Начнем с атома Nf. Все центры,
в которых может находиться этот атом азота в молекуле, представлены в
списке LOCI, в данном случае составленном из единственного атома Nm. Мы
устанавливаем соответствие ASSOCIATION (Nf Nm) между атомом в молекуле и
атомом во фрагменте. Теперь атом Nf соотнесен; мы ведем поиск среди
множества соседей (NEIGHBOR) Nf(Ca Cd). Извлекая первый элемент Са,
проверяем, был ли он ужеЪоотнесен. Когда все атомы
* Речь идет о понятии "свойство" в языке лисп. - Прим. перев.
538
К. Триндл, Р; Гиван
*А:
F1
f=2.:
FV.
П>
N
V-o О
PH'-
Р?
РИС 3 Молекула М разбита на несколько перекрывающихся фрагментов.
во фрагменте соотнесены, найден ассоциативный список MATCH. Если атом Са
не соотнесен, мы разыскиваем соотнесение среди атомов в молекуле.
Поиск новых соответствий должен быть ограничен множеством соседей
NEIGHBOR атома Nf; напомним, что должен быть сосед атома Nf с тем же
именем, что и сосед атома, находящегося в соответствии с атомом Nm. Мы
систематически устанавливаем соответствия до тех пор, пока невозможность
найти соответствие не заставит нас удалить фрагмент иди же пока не будет
установлено соответствие ASSOCIATION для каждого атома фрагмента.
5. НЕКОТОРЫЕ СПЕЦИАЛЬНЫЕ ПРОБЛЕМЫ
Эта процедура имеет некоторые недостатки, которые "раздувают" список
распознанных фрагментов. Первый недостаток иллюстрируется пиррольным
циклом. Распознанный ассоциативный список MATCH представлен как ((Nf
Nm)(Ca Cl)(Cb С2)(Сс C3)(Cd С4)), а другой - как ((Nf Nm)(Ca *C4)(Cb
СЗ)(Сс C2)(Cd Cl)). Два списка соответствующих пар (MATCH) симметрично-
эквивалентны; следовательно, в некоторой степени излишним является
требование отсутствия перекрывающихся фрагментов. Для "просеивания" этих
Программа на языке лисп
539
избыточных списков MATCHES мы проверили каждый новый MATCH, чтобы видеть,
являются ли атомы молекулы подмножеством (SUBSET) предыдущего MATCH.
Симметрично-эквивалентные пары будут генерироваться одна за другой, что
позволяет избежать необходимости поиска полного списка соответствующих
пар (MATCHES). Второй недостаток заключается в том, что, если распознан
большой фрагмент, будет много меньших фрагментов, содержащихся в большом.
Это требует от нас установления приоритета в списке фрагментов: первыми
рассмотрим большие фрагменты, а подфрагменты - только в том случае, если
большой фрагмент был отвергнут. Это близко к способу распознавания
образов человеком; большие структуры (в известных пределах) оказывают
более непосредственное воздействие, нежели меньшие.
6. ПОСТРОЕНИЕ МАТРИЦЫ РАССТОЯНИЙ
С ПОМОЩЬЮ БАНКА ДАННЫХ О ФРАГМЕНТАХ
На данном этапе разложение молекулы на фрагменты осуществлено. Наша
задача состоит в определении такого числа межатомных расстояний,
насколько это возможно сделать, используя данные о фрагментах.
Даже если мы найдем все перекрывающиеся фрагменты (а наш метод позволяет
это сделать), ряд расстояний не будет распознан как часть набора данных о
фрагментах. Если К - среднее число атомов фрагмента, М - число атомов в
молекуле и R - число распознанных фрагментов (больше, чем минимальная
величина М /К, так что имеется максимальная степень перекрывания), то мы
предполагаем, что нам будут известны все расстояния между атомами,
разделенными приблизительно К стадиями описанной выше процедуры. Из Л/(М
- 1) расстояний М(К - 1) будут лежать в пределах К стадий, и доля
расстояний, остающихся неизвестными, равна приблизительно (Л/ - К)/М. Это
представляется серьезной проблемой, но в действительности она менее
серьезна, чем кажется на первый взгляд, по двум причинам. Во-первых,
некоторые приближенные данные о расстояниях могут быть получены с помощью
ограничения, называемого "условием треугольника", позволяющего оценивать
Предыдущая << 1 .. 200 201 202 203 204 205 < 206 > 207 208 209 210 211 212 .. 216 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed