Математические методы и ЭВМ в историко-типологических исследованиях -
ISBN 5-02-009481-1
Скачать (прямая ссылка):
Сведения, собранные на базе МЧД, имеют определенную специфику, обусловленную особенностями тех источников, из которых они были извлечены. В своем исходном виде данные каждого массива, входящего в базу МЧД, представляют собой таблицы типа «объект-признак». В качестве объектов выступают отдельные лица, сведения о которых собираются в базе данных, в качестве признаков — различные характеристики этих лиц (пол, возраст, национальность, занятие, профессия, образование и т. д.). С такого рода сведениями довольно часто приходится иметь дело ис-
121следователю, работающему с социальной информацией, в том числе и историку, занимающемуся изучением массовых явлений и процессов. При этом возникают проблемы, связанные с определением социальных типов и групп, анализом структуры взаимосвязей и их динамики, выявлением факторов социального и политического развития советского общества. Об одном из способов анализа структуры взаимосвязей признаков и выявления факторов на примере обработки анкетных сведений о делегатах съездов Советов пойдет речь ниже..
Использование анкетных сведений о делегатах в базе МЧД находится в русле работы уже упомянутой группы и предназначено для изучения изменений в социальной структуре представительных органов власти в годы построения социализма в СССР. Авторы уже выступали в печати по вопросу о целях, задачах и принципах обработки анкет делегатов съездов Советов Предлагаемый в настоящей работе методический подход есть дальнейшее развитие предложенных ранее принципов, является их продолжением и вносит вклад в создание программного обеспечения, совершенствование способов обработки информации в базе данных.
* * *
Количество объектов и признаков, которые можно извлечь ИЗ анкетных сведений о делегатах каждого съезда Советов, достаточно велико. От некоторых Всесоюзных съездов отложилось более 2500 анкет. Число вопросов в анкетах, на основе которых конструируется система признаков, характеризующих состав делегатов, достигает для некоторых съездов нескольких десятков. Изучение парных зависимостей признаков может производиться на основе построения таблиц сопряженности и вычисления коэффициентов связи для каждой пары признаков — эти приемы получили широкое распространение в исторических исследованиях. Для дальнейшего анализа структуры парных зависимостей признаков могут использоваться «пороговые» методы, методы тип^ «корреляционных плеяд» и т. д., позволяющие выделить «сильные» связи, отбросив «слабые». Однако при большом числе признаков необходимо (в соответствии с современными принципами анализа данных) провести агрегирование структуры взаимосвязи признаков, построить их группировку, т. е. создать возможности для реализации системного подхода. Упомянутые выше эвристические методы не ориентированы на решение этой задачи; кроме того, этим методам присущ в целом тот же недостаток, что и методу корреляционных плеяд, в процедурах которого «учитываются только отдельные максимальные, а не средние связи между плеядами, поэтому в приложениях он дает удовлетворительные результаты лишь в самых простых ситуациях» 2.
Исходя из целей данной работы — выявления обобщенных факторов, характеризующих состав съездов Советов, анализа социально-политических изменений в составе высшего органа цла-
122сти — возникает необходимость обобщения имеющейся структурной информации на принципах многомерного анализа, что может быть достигнуто в рамках развиваемого в последние годы нового подхода к агрегированию сложных структур 3. В данной работе анализ структуры взаимосвязей признаков предлагается осуществлять на основе аппроксимационного метода, который исходит из блочно-диагональной модели структуры матрицы связи 4.. Цель метода — выделить группы взаимосвязанных признаков таким образом, чтобы взаимосвязи признаков внутри каждой группы были в среднем достаточно высокими и однородными, в то время как связи признаков из разных групп в среднем были слабее 5. Отметим, что такая группировка сохраняет возможности выявления степени существенности («нагрузки») признаков внутри каждой группы; определяется также и структура межгрупповых связей. Здесь можно отметить известную аналогию данного метода анализа структуры взаимосвязей качественных признаков и метода экстремальной группировки параметров, используемого для выявления факторов по матрице корреляций количественных признаков 6.
Рассмотрим теперь в целом предлагаемую методику изучения факторов, характеризующих состав съездов Советов СССР.
На первом этапе проводится преобразование исходной информации из базы данных — переход от большого числа значений (градаций) по некоторым признакам к меньшему их числу7. Далее вычисляются значения коэффициента связи для каждой пары признаков, в результате чего получаем матрицу связей, размеры которой ky^k (где k — число признаков, извлеченных из анкет рассматриваемого съезда). В нашей работе использовался информационный коэффициент Райского R (X, Y), хотя в принципе такие матрицы можно получить на основе любых коэффициентов взаимосвязей качественных признаков 8.