Научная литература
booksshare.net -> Добавить материал -> Энергетика -> Войтов О.Н. -> "Анализ неоднородностей электроэнерrетических систем" -> 35

Анализ неоднородностей электроэнерrетических систем - Войтов О.Н.

Войтов О.Н. , Воропай Н.И., Гамм А.З. Анализ неоднородностей электроэнерrетических систем — Нвсб.: Наука, 1999. — 256 c.
ISBN 5-02-031231-2
Скачать (прямая ссылка): analizneodekekenerg1999.djvu
Предыдущая << 1 .. 29 30 31 32 33 34 < 35 > 36 37 38 39 40 41 .. 77 >> Следующая

Методы классификации по матрицам показателей сходства или
различия объектов делятся на два вида — методы восходящей и
3.8. КЛАСТЕРНЫЙ АНАЛИЗ
117
нисходящей иерархических классификаций. В первом случае все объекты заданной совокупности изначально считаются принадлежащими разным кластерам, после чего проводится пошаговое объединение кластеров, обладающих наибольшим взаимным сходством. Во втором случае все объекты изначально считаются принадлежащими одному кластеру, а затем выполняется пошаговое разбиение этого кластера на более мелкие с помощью разнесения наименее взаимно сходных объектов по разным кластерам.
Традиционные методы иерархической восходящей классификации пошагово "восходят" от набора единичных объектов с известными значениями (показателями) их взаимного сходства или различия к набору кластеров объектов. Эти методы различаются друг от друга способами определения на шагах классификации показателей сходства или различия кластеров. Известны* (см., например,
метод среднего (средней связи, Кинга) — когда взаимное сходство (различие) двух кластеров определяется как среднее ариф-
метод максимума (полной связи, дальнего соседа) — когда взаимное сходство (различие) двух кластеров принимается равным минимальному сходству (максимальному различию) принадлежащих им объектов
ри = тш(/?0|/ е /, ] е /) и йи = тах(</|7|/ е /, у 6 /); (3.43)
метод минимума (одной связи, ближнего соседа) — когда взаимное сходство (различие) двух кластеров принимается равным максимальному сходству (минимальному различию) принадлежащих им объектов
ри = тах(ри\1 е /, у е /) и йи = тт(</|7|/ Е /, у е /). (3.44)
Из этих трех методов метод дальнего соседа обеспечивает наиболее компактную классификацию в том смысле, что различие между объектами, принадлежащими одному (любому) кластеру,
*3десь /и у — объекты, принадлежащие кластерам / и /; Рц и Р{1 — соответственно показатели сходства между объектами г, } и кластерами /, J\ е!{. и
— соответственно показатели различия между объектами I, } и кластерами /, /; М — число связей между кластерами 1 и 1.
[77, 78]):
(3.42)
j<EJ
118
Гл. 3. МЕТОДЫ АНАЛИЗА НЕОДНОРОДНОСТЕЙ ЭЭС
оказывается на каждом шаге классификации обычно меньше, чем при использовании двух других методов. Метод ближнего соседа, напротив, может порождать так называемые цепочечные кластеры — когда различие между объектами кластера может быть очень велико (и часто существенно больше, чем между объектами разных кластеров). Метод средней связи занимает промежуточное положение между двумя предыдущими методами.
Разбиение совокупности объектов на кластеры подразумевает дальнейшее рассмотрение этих кластеров как новых агрегированных объектов. Следовательно, процесс классификации должен быть остановлен на том шаге, результат которого еще не вносит недопустимой погрешности в получающееся агрегированное представление системы. Для этого требуется задание порога когерентности*, т.е. минимальной величины меры когерентности, когда еще допустимо объединение генераторов в группу (кластер). Кроме того, введение порога когерентности помогает ослабить отмеченный выше недостаток подходов, базирующихся на методе ближнего соседа. Для этого вводится дополнительное правило (называемое
иногда коммутативным), которое требует, чтобы степени когерентности добавляемого в группу генератора со всеми генераторами этой группы были не ниже порога когерентности. С точки зрения кластерного анализа применение коммутативного правила сводится к комбинации базовых методов — ближнего соседа и ограничений по методу дальнего соседа.
Необходимость эвристического задания порога когерентности, безусловно, является недостатком (причем присущим любым методам восходящей классификации). При неочевидности значения этого порога используется отслеживание изменения по шагам некоторого показателя "качества" классификации, связанного с погрешностью, из-за рассмотрения всех объектов, принадлежащих кластеру, как единого агрегированного объекта. Таким способом часто удается снизить требования к точности задания величины порога.
Основной проблемой при использовании методов восходящей классификации является выбор метода (или комбинации методов) классификации, т.е. правила определения показателей сходства кластеров как функций показателей сходства объектов. На каждом шаге классификации требуется агрегирование в одно значение значений показателей сходства между собой объектов, принадлежащих каждой паре кластеров. Универсальных способов такого
Желательно, чтобы физический смысл показателей сходства позволял однозначно определить этот порог — в противном случае приходится назначать порог когерентности и оценивать результат классификации экспертно.
3.8. КЛАСТЕРНЫЙ АНАЛИЗ
119
агрегирования в начале раздела было названо три, а выбор способа или их комбинации для конкретного случая в общем зависит от физического смысла используемых показателей и, как правило, неочевиден. Кроме того, физический смысл показателей сходства может определять и более предпочтительные в конкретном случае специфические способы агрегирования, что для каждого вида показателей требует отдельного исследования (см., например, [85, 88, 104, 105]).
Предыдущая << 1 .. 29 30 31 32 33 34 < 35 > 36 37 38 39 40 41 .. 77 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed