Научная литература
booksshare.net -> Добавить материал -> Биология -> Андреев В.Л. -> "Классификационные построения в экологии и систематике" -> 20

Классификационные построения в экологии и систематике - Андреев В.Л.

Андреев В.Л. Классификационные построения в экологии и систематике — М.: Наука, 1980. — 142 c.
Скачать (прямая ссылка): klassifikacionniepostroeniyavekologii1980.pdf
Предыдущая << 1 .. 14 15 16 17 18 19 < 20 > 21 22 23 24 25 26 .. 58 >> Следующая

ным q — 1. Эти классы принадлежат разбиению Ж(2К являющемуся сгущением Ж^. Если имеется п одинаково схожих объектов, то объединяются любые два из них. Среди оставшихся снова отыскиваются наиболее схожие, которые объединяются, и так действуем до тех пор, пока все объекты не попадут в один класс Ж
Существует много способов построения дендрограммы, из которых рассмотрим простейшие, основанные на пспользовании матрицы мер сходства.
Воспользуемся данными табл. 3.7 и отыщем в ней наибольшее значение. Таковым оказывается С (Rb, Д4)0 = 60, значит, наиболее схожими являются описания Rs и Д4, которые и объединяем в один класс Я(4!) — {i?4, R6}. Условимся подстрочный индекс для обозначения более широкого класса выбирать минимальным на множестве индексов входящих в него классов.
Теперь определим сходство этого нового класса со всеми остальными как попарные расстояния между двумя множествами. Для этого выписываем отдельно элементы четвертой строки и четвертого столбца, а также элементы пятой строки и пятого столбца. Получаем
C(Rj, Д4):44 51 57 C(Rj,RB); 34 47 50
44 43 46 49 40 50.
Здесь точками отмечены диагональные элементы. Сравнивая поэлементно оба массива, отбираем каждый раз элемент с наибольшим значением и формируем из них новый массив (элементы в квадратике опускаем):
C(Rj, Ri.b): 44 51 57 • 49 43 50.
Этот массив и вписываем на место четвертой строки и четвертого столбца, а элементы пятой строки и пятого столбца вычеркиваем. В результате получаем новую матрицу
‘51 •
50 57 •
44 51 57 •
25 29 32 49 •
20 23 31 43 53 •
24 31 40 50 48 52
В ней наибольшие значения имеют элементы С (R2, Ra)
С (#4.в, Л5). Для определенности выбираем первый из на:
а вторые строку и столбец объединяем с третьими строкой и столбцом: _______
C(Rh Я2): 51 . 57 51 29 23 31
С (Rj, Rz): 50 57 • 57 32 31 40
C(R}, Rzs) : 51 • 57 32 31 40
Новая матрица имеет вид
51 •
44 57 .
25 32 49 .
20 31 43 53 •
24 40 50 48 52 .
В ней наибольший элемент С (й4.5, R2.3) = 57. Получаем новое название второй строки: i?4.5.2.3 и т. д.
Выпишем результаты каждого шага в виде перечисления индексов в том порядке, в каком объединялись классы, а также уровни сходства, на которых это объединение происходило:
4-5 -60
2-3 - 57
4 ¦ 5 • 2 • 3 - 57
6-7 - 53
6-7-8-52
4-5-2-3-1 — 51
4-5-2-3-1-6-7-8 — 50
Эти результаты используются для построения дендрограммы следующим образом.
Проведем вертикальную линию на плоскости и проградуируем ее в пределах изменения уровней сходства, в данном случае от 100 До 50 (рис. 3.6). На уровне 100 расположим по горизонтали восемь точек и пронумеруем их в том порядке, который указан в последней строке вспомогательной таблицы. Далее, следуя этой таблице, соединим точки по вертикали: первыми соединяются вершины 4 и 5, причем ордината точки сочленения равна 60, а абсцисса — середине расстояния между этими точками. Прочие построения довольно очевидны.
Дендрограмма делает наглядной структуру иерархической системы сходства. В данном примере наибольшим сходством обладают и i?5i наименьшим — классы #{8) = {Л4, R6, R3, R2, Rx} и #58) = {i?e, R-, Л8}. Вершина Rs, как можно видеть, попадает в один класс с описаниями нйзкобореальной подобласти.
Отметим одно немаловажное обстоятельство, касающееся способа определения сходства каждого вновь образованного класса со всеми остальными. В описываемом примере это был просто выбор максимального значения из двух, соответствующих новому объединению, но иногда более полезными оказываются иные приемы.
В обзоре [24] приводятся шесть наиболее употребительных методов, которые описываются единой формулой:
где G (Hj, Нк) означает меру сходства или различия классов Hj п Я, = {Ни, Не}.
Параметры аи, ае, (3, у задают вид процесса:
1) минимальные значения: аи = ае — 1/2, р = 0, у = —1/2;
2) максимальные значения: аи = ае = 1/2, (5 = 0, у = 1/2;
3) медиана: аи = ае = 1/2, (3=0, у = 0;
4) среднее группы: аи = пи/щ, ае = пе/пк, р = у — 0;
5) центропдный метод: аи = njnk, ае = njnk, (3 = —аиае,у = 0;
6) метод Уорда:
Самый предпочтительный метод, по нашему мнению,— метод средней
где пи, щ — число объектов соответственно и-то и Ar-го классов; Пк — пи + пе- Из формулы видно, что вместо выбора максимального значения, как было показано в примере, из элементов двух сравниваемых строк С (Rj, Ru), С (Rj, Re) находим средневзвешенное значение.
'Вид дендрограммы существенно зависит от выбора мер сходства и метода кластеризации, из которых наиболее сильное влияние оказывает мера сходства.
Чтобы проиллюстрировать это влияние, используем данные матрицы мер пересечения (см. табл. 3.6) для построения дендрограммы на основе неэквивалентной (3.16) меры:
G (Hh Нк) = auG (Hjt Ни) + aeG (Hj, Ht) + pG (Hu, He) -f -ry[G(Hj, Hu)-G(Hj, He)],
Предыдущая << 1 .. 14 15 16 17 18 19 < 20 > 21 22 23 24 25 26 .. 58 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed