Научная литература
booksshare.net -> Добавить материал -> Математика -> -> "Математические методы и ЭВМ в историко-типологических исследованиях " -> 82

Математические методы и ЭВМ в историко-типологических исследованиях -

Ковальченко И.Д. Математические методы и ЭВМ в историко-типологических исследованиях — М.: Наука , 1989. — 271 c.
ISBN 5-02-009481-1
Скачать (прямая ссылка): matematmetodiissledovaniya1989.djvu
Предыдущая << 1 .. 76 77 78 79 80 81 < 82 > 83 84 85 86 87 88 .. 124 >> Следующая


В этой связи встает вопрос, что же считать? К сожалению, в литературе, посвященной такого рода вопросам, нет сколько-нибудь универсальной единицы счета, могущей быть использованной при количественном анализе смысла текста. Поэтому в основу был положен хорошо зарекомендовавший себя принцип выделения на основе детального изучения текста книги Милюкова основных смысловых категорий представленного автором историографического материала и их последующий анализ.

Однако, имея в виду выделение и просчет такого рода категорий в тексте, необходимо привести его сначала к уровню, на котором можно их выделить. Формализация же текста, где сильны художественные традиции, нуждается в предельной конкретизации и однозначной трактовке текста. Наиболее конкретная информация такого рода содержится в основах предложений. Однако знание и учет одной основы не даст информации для счета. Ведь без ближайших второстепенных членов мы не сможем понять сущности формализуемого нами смыслового материала. Поэтому круг нашего внимания следует ограничить рамками простого предложения. «Переписанный» таким образом текст состоит уже только из простых предложений. Попутно он лишается и своих

175 так сказать «художественных излишеств», оборотов, сравнений и пр., приобретая при этом сугубо информативный характер.

Например, такое сложносочиненное предложение, как «В передовых странах Европы растет число городских жителей; это необходимо для удовлетворения внутренних потребностей страны, а производительность главных промышленных центров Западной Европы переросла национальные рамки»9, после сокращения будет выглядеть так: «В странах Европы растет число горожан». «Такая картина необходима для внутренних потребностей страны». «Производительность промышленных центров Западной Европы стала интернациональной».

Таким образом, мы получаем предельно конкретную и сжатую информацию. Конечно, такой способ формализации не рассчитан на учет всей массы скрытой информации. Однако он, как правило, подается автором в такой форме, что учет фактов такого рода будет зависеть от субъективного взгляда читателя, тогда как грамматические формы выражения открытой информации позволяют существенно эту многозначность ограничить.

Чаще всего в подобных работах для насыщения состава категориального аппарата из текста извлекают основные понятия, характеризующие лицо этой смысловой единицы. Однако в данном случае такой путь кажется малоприемлемым. Дело в том, что зачастую автор применяет те или иные понятия не по прямому назначению, а в качестве разного рода синонимов и сравнений, что обусловлено спецификой исторического исследования, где от автора не требуется такого точного характера определений, как в естественных науках, что дает возможность в угоду стилю заменять их по своему усмотрению. Мы придерживались другого принципа — на основе единичных положений, исторических фактов, используемых автором, создавать определенные категории, на которые и ориентироваться в дальнейшей работе.

Итак, «переписанный» и освобожденный от литературного оформления текст представляется как список категорий, расположенных по абзацам внутри исследуемого очерка.

При разнесении фактов по категориям мы сталкивались с вопросом о многозначности некоторых из них. В этих случаях мы придерживались правила, по которому один и тот же факт может быть представлен столькими категориями, насколько он их представляет.

Математическим методом, которым мы будем пользоваться в практике работы, стал контент-анализ. Он давно используется в практике статистических исследований нарративных источников и достаточно хорошо себя зарекомендовал в подобных работах 10.

Применительно к данной работе содержательный смысл контент-анализа состоит в оценке относительной взаимосвязанности выделенных в тексте категорий. Степень такой взаимосвязанности определяется частотным показателем сопряженности исследуемых категорий. Его максимальное значение 100%. Это значит, что исследуемые категории во всех случаях фигурируют совместно.

176 Обратную ситуацию означает показатель, равный нулю. Таким образом, перед нами показатель меры вероятностного употребления во взаимосвязи различных категорий в рамках исследуемого текста.

Количество категорий, подвергаемых обработке, выделяется путем включения в предварительную матрицу частот встречаемости всех выделенных нами категорий. Сразу же отсеиваются категории, имеющие показатели, близкие или равные нулю. В дальнейшем для создания массива представительных категорий использовался порог встречаемости, который отсеивал категории, парная встречаемость которых в рамках изученных очерков не превышала 15% рассмотренных случаев (КПК-0,15).

В итоге мы получили 34 представительные категории, которые и подверглись статистической обработке. Их распределение по очеркам оказалось таковым: более всего — 13 — выпало на долю очерка «Экономический быт», 12 — в очерке «Сословный строй» и менее всего — 9 — в очерке «Государственный строй». Среди выделенных категорий имеется ряд «сквозных», которые повторяются во всех очерках (например, «Военная опасность» («Ведение войны»), «Контраст России и Запада», «Административно-финансовые перемеры» и пр.), и ряд категорий, присущих только изучаемым очеркам. Их оказалось несколько больше.
Предыдущая << 1 .. 76 77 78 79 80 81 < 82 > 83 84 85 86 87 88 .. 124 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed