booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 123

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu

Предыдущая << 1 .. 117 118 119 120 121 122 < 123 > 124 125 126 127 128 129 .. 183 >> Следующая

(2 Р) п0 всем объектам, попавшим в дециль, было определено ожидаемое число случаев болезни в каждом дециле. Ниже в таблице приведены ожидаемые и наблюденные количества случаев болезни коронарных сосудов. Критерий согласия %а показывает, что модель соответствует данным (%2 = 10.9 и %2 = 12.8 для мужчин и женщин соответственно, Р > 0.10).
Децили^ риска Р Мужчины Жгащи.; ы
Ожидаемое Наблюдаемое Ожидаемое Наблюдаемое
10 90,5 82 70.4 54
9 47.1 44 24.7 23
8 32.6 31 15.0 21
7 25.0 33 9.8 14
6 19.7 22 6.5 5
5 15.0 20 4.4 6
4 11.5 13 3.2 2
3 ' 8.6 10 2.-3 0
2 6.0 3 1.7 3
1 3.4 0 1.1 1
5.4. Классификация в случае к популяций
В этом разделе рассматривается случай отнесения неизвестного вектора наблюдений хрХ1 = (хЛ, хр)' к одной из к популяций 1=1..... к, к 5э 2.
5.4. Классификация в случае к популяций
336
Раздел 5.4.1 посвящен общему случаю классификации, когда объекты в популяциях распределены произвольно и параметры известны; в разд. 5.4.2 рассматривается случай, когда распределения в считаются многомерными нормальными; в разд. 5.4.3 представлена задача классификации в случае популяции с биномиальным распределением.
5.4.1. Классификация в случае популяций
с произвольными известными распределениями
Пусть (х) означает плотность распределения х в №1 и ^ — априорную вероятность того, что вектор наблюдения х принадлежит популяции I = 1, Обозначим стоимость отнесения наблюдения из ЦТ? к через С (»' | /), а вероятность отнесения наблюдения из ХР] к — через Рг (; | /), I, / = 1, к, I Ф /. Полагая, что все параметры известны, можно показать, что обобщенная байесовская процедура классификации относит вектор х к если величина
(*) С (ф) (5.4.1)
/=1 Ж
является максимальной, 1 = 1, (Если одинаковый мак-
симум достигается как в г\, так и в ?4, то х относится к И^,или №;2.) Величина (5.4.1) называется значением дискриминантной функции для 1-й популяции. Байесовская процедура минимизирует ожидаемую стоимость ошибочной классификации
Д С(г|/) Рг (5.4.2)
Когда стоимость ошибочной классификации не имеет значения, все С (? | /) полагаются равными и процедура Байеса относит х к 'Шь если
ЧШ (5-4.3)
имеет максимальное значение, I — 1, Таким образом, мини-
мизируется ожидаемая вероятность ошибочной классификации
.|?/{|;Рг ('!/')}• (5.4.4)
Заметим, что это эквивалентно отнесению х к Ш{, если ^апостериорная вероятность
Рг(^.|х) = _^_ (5.4.5)
достигает максимума.
336
Гл. 5. Методы многомерного статистического анализа
5.4.2. Классификация в случае популяции
с многомерными нормальными распределениями
Пусть популяция №, имеет распределение N (црх1, ^рхр) с функцией плотности (х), / = 1, Будем считать, что все параметры известны и стоимости ошибочных классификаций равны. Подставляя (х) в выражение (5.4.3), логарифмируя и исключая общие множители, получаем линейную дискриминантную функцию для 1-й популяции
бг = «гЛ + ' • • + ЩрХр + 7,-1п Ци I == 1,. . ., Дг. (5.4.6)
В замечании 5.4.1.6 эти уравнения относительно коэффициентов аа, а1п и константы ^ приводятся в матричной форме. Итак, вектор наблюдений х относится к популяции если значение бг является максимальным среди всех I = 1, 1г. Апостериорная вероятность (5.4.5) принимает вид
Как уже было замечено, предположение о том, что параметры. распределений известны, облегчает только теоретическую часть анализа. На практике, как правило, имеются независимые случайные выборки из & популяций, по которым можно получить оценки параметров. При этом не существует оптимальной процедуры классификации, но подстановкой состоятельных оценок в выражение (5.4.6) можно получить асимптотически оптимальную процедуру. Пусть щ — объем г-й выборки, х; — ее вектор средних и — ковариационная матрица, / = 1, к. Тогда в формуле (5.4.6) можно заменить ц, на х,- и 2 — на объединенную ковариационную матрицу 8:
Таким образом, оценка дискриминантной функции для 1-й популяции имеет вид
^ = аахг И----+ а1рхр + с,- + 1п ць 1 = 1,..., к. (5.4.9)
В замечании 5.4.1.6 приводятся выражения для коэффициентов а-Л, а:р и постоянных С, в матричной форме. Вектор х классифицируется, как принадлежащий популяции №г, если величина д.1 имеет наибольшее значение. При этом оценка апостериорной вероятности имеет вид
(5.4.7)
(5.4.8)
(5.4.10)
5.4. Классификация в случае k популяций
337
Программы дискриминантного анализа предназначаются, как правило, для вычисления следующих величин:
a) объединенной матрицы ковариации S и иногда ковариационных матриц для популяций Wh i = 1, k;
b) оценок для коэффициентов линейной дискриминантной функции ап, alv и постоянной cL для популяции W,, i = 1, k;
c) оценок значения линейной дискриминантной функции для каждого элемента х1т выборки из Wh т = 1, п:, i = 1, k;
d) оценки апостериорной вероятности для каждой популяции Wj при заданном векторе xim, который является m-м элементом выборки из Wt, т = 1, ..., щ, i, j = 1, ..., k;
e) номеров популяций, к которым относятся векторы — элементы выборки из Wt, т = 1, п.;, i = 1, k (тех популяций, для которых оценка апостериорной вероятности для дискриминантной функции достигает наибольшего значения).

Предыдущая << 1 .. 117 118 119 120 121 122 < 123 > 124 125 126 127 128 129 .. 183 >> Следующая