Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 127

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 121 122 123 124 125 126 < 127 > 128 129 130 131 132 133 .. 183 >> Следующая

Шаг 1. Переменная Х1Ъ которой соответствует наибольшее значение /-"-включения, считается первой. Для каждой популяции №г, I = 1, оценивается коэффициент и определяется постоянная
линейной дискриминантной функции. Кроме того, вычисляется таблица результатов классификации, ?/-статистика и ее г7-аппроксимация. Вычисляется также значение /-"-удаления ей — 1 и п — к степенями свободы для переменной Х}Х, которое равно значению /-"-включения. Затем находится значение /-"-включения с & — 1 и п — & — 1 степенями свободы для каждой из пере-
346
Гл. 5. Методы многомерного статистического анализа
менных, не включенных в искомое подмножество. Таким образом, проверяется гипотеза Я0: = • • • ---= цА/.У1, где ц0-.Л —
среднее условного распределения Х7- в популяции №1 при фиксированном значении переменной Х-п, ? — 1, 6, / = 1, р, \ Ф \г. Если все значения /-"-включения меньше его минимума, то выполняется шаг Б, в противном случае процедура переходит к выполнению второго шага.
Шаг 2. Выбирается переменная Х7-2, для которой значение /•"-включения максимально. Вычисляются оценки двух коэффициентов и постоянные дискриминантных функций для каждой популяции ? = 1, 6. Определяется таблица результатов классификации, ^-статистика и ее /-"-аппроксимация. Кроме того, для и Х/2 ищутся значения статистик /-"-удаления с к — 1 и п — % — 1 степенями свободы. Таким образом, проверяются соответственно гипотезы #„: —¦¦•== Щ/,.;, и Н0:
^1/2/1 = ••• = Н-*/,./,. Затем для каждой не включенной переменной вычисляется статистика /-"-включения с & — 1 и п — ? — 2 степенями свободы. С ее помощью проверяется гипотеза #„: = • • • = Уы-ии> гДе \*-Ч-1ф — среднее условного распределения Х} при заданных Хп и л^2 в популяции ? = == 1, / = 1, р, } Ф }и Если все значения /-"-включе-ния меньше установленного минимума, то выполняется шаг Б, в противном случае — шаг 3.
Шаг 3. а) Обозначим символом Ь множество из ? переменных, предварительно отобранных для построения процедуры классификации. Если значение /-"-удаления меньше принятого минимума хотя бы для одной переменной из Ь, то переменная, для которой это значение минимально, исключается из Ь и выполняется (Ь), в котором ? заменяется на ? — 1. Если теперь некоторые значения /-"-включения для переменных, не принадлежащих Ь, больше принятого для этой статистики минимума, то переменная, для которой это значение максимально, включается в Ь и ? заменяется на ? + 1.
Ь) Для каждой популяции №ь ? == 1, оцениваются ?
коэффициентов дискриминантной функции и вычисляется постоянная. Определяется таблица результатов классификации, значение ^-статистики и ее /-"-аппроксимация. Кроме того, для каждой переменной из Ь вычисляется значение /"-удаления и соответствующие степени свободы. Тем самым проверяется гипотеза Н0: М-ьи-п • • ¦ — Н<*з-('-О для каждой переменной Хг из Ь при фиксированных значениях остальных ? — 1 переменных из Ь. Символом р,43.(/_1) обозначается среднее условного распределения переменной Х$ в №1 при фиксированных значениях остальных переменных в И наконец, вычисляется значение статистики /-"-включения и соответствующих степеней свободы для
5.5. Пошаговый днскрнмннантный анализ
347
каждой переменной, не включенной в L. Таким образом, проверяется гипотеза Я0: = = (/). гДе V-tj-u) обозначает среднее условного распределения переменной Xj в Wt при фиксированных значениях всех переменных из L, i = 1, k, I = 1, р, Xj не принадлежит L.
Шаги 4, 5, ... .Шаг 3 повторяется рекуррентно. Когда F-вклю-чения становятся меньше заданного минимума для всех переменных, не включенных в L, или когда все переменные оказываются включенными в искомое подмножество и значение /-"-удаления становится меньше заданного минимума, выполняется шаг S. В некоторых программах рекуррентная процедура останавливается также и в том случае, когда / = min (щ), i = 1, k.
Шаг 5. На этом шаге для каждого вектора xim, т = 1, щ, i = 1, k, производится вычисление апостериорных вероятностей его принадлежности к популяциям vTi, Wk. На основании этих вероятностей каждый объект классифицируется как принадлежащий одной из популяций и составляется таблица результатов классификации.
Обычно по требованию пользователя можно вывести на печать таблицу, в которой отображаются действия процедуры на каждом шаге. Кроме того, на каждом шаге выводятся следующие величины: номер шага, включенные и удаленные переменные, значения статистик /""-включения и /-"-удаления, ?/-статистика и ее F- аппроксимация.
Замечания 5.5.1. 1. Это замечание справедливо только для случая k = 2.
a) Дискриминантная функция (5.3.26) получается как разность двух дискриминантных функций для разных популяций (см. 5.4.9), т. е. aL — аи — а2,- и (гх + <г2)/2 = С2 — Сх.
b) Как уже было отмечено, F-аппроксимация статистики U, построенная по q переменным в случае двух классов, является точной. Более того, используя значение F, можно получить оценку расстояния Махаланобиса Dq для q переменных
™ = Я(П1 + пМпх + п,-2) (р.аппроксимация щ
9 "1«2 («1 +«2— Я— ') ^
Предыдущая << 1 .. 121 122 123 124 125 126 < 127 > 128 129 130 131 132 133 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed