Научная литература
booksshare.net -> Добавить материал -> Математика -> -> "Математические методы и ЭВМ в историко-типологических исследованиях " -> 110

Математические методы и ЭВМ в историко-типологических исследованиях -

Ковальченко И.Д. Математические методы и ЭВМ в историко-типологических исследованиях — М.: Наука , 1989. — 271 c.
ISBN 5-02-009481-1
Скачать (прямая ссылка): matematmetodiissledovaniya1989.djvu
Предыдущая << 1 .. 104 105 106 107 108 109 < 110 > 111 112 113 114 115 116 .. 124 >> Следующая


Поставленная задача классификации превращается в задачу приведения матрицы А к виду, названному нами окаймленным:

AJ

A0

(I)

с помощью перестановок строк и столбцов. Блоки Ai, А2... As (не обязательно квадратные) будем называть диагональными; строки, входящие в Ao, и столбцы, входящие в Во, будем называть окаймляющими. Строки fc-го диагонального блока отвечают k-Pi группе объектов, столбцы этого блока — характеризующим данную группу признакам. Окаймляющие строки соответствуют переходным формам объектов, а окаймляющие столбцы — признакам, общим для всех или ряда групп.

235 Окаймленный вид матрицы является моделью любой классификации, выделяющей вместе с группами объектов присущие только данной группе признаки. Известно, что в зависимости от того, как оценивает специалист значимость тех или иных признаков, можно-получить различные варианты классификации материала даже при одной и той же цели, например выделении хронологических групп. Эта неоднозначность вызывает необходимость сравнения классификаций и выбора наиболее удачных, для чего в теории классификации вводится так называемый функционал (критерий) качества классификации 2. Классификация, обладающая наилучшим значением критерия, объективно может считаться наиболее обоснованной. В нашей работе предлагается критерий, который неформально можно описать так: классификация тем «лучше», чем меньше вероятность получить ее при случайной выборке из однородной совокупности. Построение формул расчета этой вероятности P приведено в Прил. 1. Для всех более или менее реальных классификаций эта величина очень мала, и поэтому удобнее пользоваться величиной InP, названной нами убедительностью классификации.

Наряду с показателем, оценивающим реальность классификации, желательно располагать также формальной оценкой ее информативности для исследователя. Для этого рассматривается энтропия (мера неопределенности), связанная с каждым признаком, до и после проведения классификации. Суммарное снижение энтропии по всем признакам и определяет информативность, названную в работе «признаковой». В случае, если желательно сравнить классификации, использующие различные наборы признаков, приходится вводить более общую (но, к сожалению, менее точную) меру информативности, называемую «общей». Она определяется снижением энтропии, связанной с матрицей А в целом (см. Прил. 2).

Предложенные оценки достаточно устойчивы в условиях неодинаково подробного описания объектов, их использование допустимо при различной значимости признаков и отсутствии части данных, что характерно для археологического материала. Введенные оценки имеют ясную содержательную интерпретацию.

Для построения классификаций, оптимальных по критерию информативности, удалось построить алгоритм типа «ветвей и границ». Методы этого типа представляют собой процедуру поиска оптимальной классификации среди всех возможных вариантов путем последовательного деления множества исследуемых вариантов на части (ветвления). На каждом шаге алгоритма для всех еще не разделенных групп вариантов вычисляется оценка, более или менее грубо определяющая заведомую верхнюю границу, которую не могут превосходить значения критерия для всех вариантов, входящих в группу. Группа с наибольшей оценкой считается наиболее перспективной и подвергается дальнейшему разделению. Для полученных подгрупп уточняются оценки (они могут лишь уменьшиться), снова выбирается наиболее перспективная группа и

236 так далее. Допустим, что в процессе ветвления получен вариант, значение критерия для которого не ниже, чем оценки для еще не ветвленных групп. Это означает, что варианта с лучшим значением критерия нет, оптимум найден и процесс ветвления закончен. Процесс иллюстрируется рис. 30, где числа внутри кружков обозначают число вариантов в группе, около каждого кружка указана оценка; выбираемая для ветвления вершина заштрихована. Способ ветвления групп и метод подсчета оценок для предложенного в работе алгоритма описаны в Прил. 3.

Алгоритмы этого типа, к сожалению, требуют очень большого числа операций для получения решения и поэтому непригодны для построения классификаций многочисленных объектов с большим числом признаков. Для такой ситуации в работе предложен чрезвычайно простой эвристический алгоритм, дающий, как показали расчеты, достаточно высокие значения всех введенных оценок качества классификаций (см. Прил. 4).

Общей чертой предложенных алгоритмов является выделение переходных блоков объектов и признаков, что в некоторых случаях важно для интерпретации результатов классификации. Допускается использование уже установленных на содержательном уровне анализа материала результатов, например априорного отнесения объектов или признаков к одной или другой группе на основе данных, не используемых при формальном анализе. Описанный подход можно рекомендовать для классификации объектов с многочисленными качественными признаками тогда, когда желательно выявить не только различия, но и существующие между выделенными группами связи.

Предложенные методы были применены для исследования погребений с трупоположениями, относимых к Черняховской культуре. Классификация этих памятников представляется в настоящее время окончательно не установленной, в то же время важность такой работы не вызывает сомнений: вопросы этнической принадлежности, выделения локальных вариантов, степени и характера их общности являются для этой культуры дискуссионны-
Предыдущая << 1 .. 104 105 106 107 108 109 < 110 > 111 112 113 114 115 116 .. 124 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed