Математические методы и ЭВМ в историко-типологических исследованиях -
ISBN 5-02-009481-1
Скачать (прямая ссылка):
Величины индексов а и ds равны 1, 2 ... k, меняются от 0 до 1. Чем меньше значение индекса, тем ближе, согласованнее результаты голосований всех членов конгресса или отдельного блока. Среднее значение величины dq:
(I)
i,j є cs,і < /
(И)
k
(III)
6 Зак. JVb 2235
161будем называть средней внутриблоковой компактностью. Этот индекс показывает, насколько в среднем компактны (согласованы по своим позициям) блоки законодателей, образующие данную классификацию.
Чтобы оценить степень различия между голосованиями двух блоков Cs и Ct, введем индекс различия
Чем больше значение индекса dst, тем более различны по результатам голосований (а следовательно, по своим позициям) законодатели из блоков Cs и Ct. Усреднив все величины dst, получим индекс, который будем называть средним межблоковым различием:
Индекс D показывает, насколько в среднем похожи или, наоборот, различны блоки законодателей, выделенные данной классификацией. Величины d, dst и D также изменяются от 0 до 1.
Таким образом, индексы d (средняя внутриблоковая компактность) и D (среднее межблоковое различие) совместно характеризуют четкость, контрастность анализируемого разделения законодателей на блоки. Эти индексы, как и отношение d/D, могут использоваться двояко. Если анализируемая классификация выведена непосредственно (и корректно) из отношений сходства и различия в матрице S, то величина d/D служит мерой контрастности самой голосовательной структуры. Если же классификация задана исследователем (разделение законодателей по географическому, возрастному, партийному и другим признакам) , то величина d/D покажет, насколько точно такая внешняя классификация описывает объективную структуру различий между позициями законодателей, выраженными в результатах их голосований. В обоих случаях чем меньше d/D, тем больше похожи результаты голосований у законодателей из одного блока и меньше — у законодателей из разных блоков. Если d/DaI, то либо (в первом случае) в исходных данных отсутствует «естественная» структура, либо (во втором случае) она существует, но заданная извне классификация ее совершенно не отражает.
Итак, все эндогенные характеристики хотя и работают с любыми классификациями, но отличаются тем, что «замкнуты вовнутрь», помогая ответить на вопрос: насколько любая анализируемая классификация согласована с исходными данными, представленными в матрице близости. Важно отметить, что величины ds, d, dst и D можно сделать независимыми от масштаба измерения близостей Sij, разделив первые на величину а. Тогда указанные индексы будут фиксировать то, насколько отношения сходства и различия? - выделенные данной классификацией,
(IV)
/<= Cs./<= Cl
(V)
162существеннее, чем средняя близость между всеми законодателями.
Теперь рассмотрим вторую группу характеристик, названных экзогенными. В отличие от предыдущих, они не замкнуты на матрицу близости и служат для сравнения любых классификаций («естественных» и заданных исследователем) с некоторой переменной, порожденной каким-либо внешним критерием. Экзогенные характеристики помогают ответить на вопрос, насколько анализируемая классификация связана (согласована) с выбранной переменной. Их можно использовать, в частности, и для объяснения полученных классификаций посредством внешних критериев.
Строятся экзогенные характеристики по общей стандартной схеме. Разумно предположить, что классификация согласована с переменной, если значения переменной постоянны для объектов одного класса и различны для объектов, принадлежащих к разным классам. Мера реализации этого правила и будет искомой характеристикой согласованности. Конкретный вид эти характеристики могут принимать в зависимости от того, в какой шкале получена переменная, задаваемая внешним критерием, а также в зависимости от других традиционных статистических соображений.
В данной работе этот подход использовался для того, чтобы классифицировать объекты еще одного вида — законодательные предложения, которые ставились на голосование. Задача состояла в том, чтобы найти способ измерить интенсивность идеологического конфликта, вызванного каждым отдельным предложением, а затем выделить группы предложений, служивших поводом интенсивного, умеренного и слабого идеологического конфликта.
Уже из постановки задачи ясно, что вторая классификация должна быть тесно связана с первой — разделением законодателей на идеологические блоки. Вполне естественно предположить, что интенсивность идеологического конфликта, вызванного некоторым предложением, тем выше, чем больше «либералов» и «консерваторов» проголосовало друг против друга. Сравнивая разделение на большинство и меньшинство в отдельном голосовании («внешняя» переменная) с экспериментальной классификацией «либералы / центр / консерваторы», можно оценить, насколько эти две структуры согласованы между собой, т. е. в какой степени раскол голосов по данному предложению был проявлением более общего конфликта между «либералами» и «консерваторами».
Важно учесть, что некоторый уровень согласованности между частным расколом «большинство / меньшинство» и любой классификацией, в том числе нашей, может возникнуть и случайно, причем вероятность такого случайного совпадения тем выше, чем внушительнее перевес большинства над меньшинством. Поэтому любой анализ согласованности между частной (наблюдаемой) и общей структурами должен иметь в основе вероятностную оценку — «нулевую гипотезу». Иначе (как показали, например, Г. Хэммонд и Дж. Фрэзер на примере так называемой