Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 128

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 122 123 124 125 126 127 < 128 > 129 130 131 132 133 134 .. 183 >> Следующая

где q = 1, р, а пх и п2 — объемы выборок соответственно из Wx и iT2.
c) Предположим, что включенные переменные Хх, Xq составляют множество L,q = 1, р — 1. Для того чтобы узнать, не вносят ли переменные Xq+X, Хр значимый вклад в разделение по Хх, Xq, можно проверить гипотезу Я„: А'^ = Ар, где Am — расстояние Махаланобиса между популяциями, измеренное по т переменным, т = р, или q, q = 1, р — 1. Для проверки Я0
348
Гл. 5. Методы многомерного статистического анализа
обозначим выборочные оценки Ар и А| соответственно символами D,, и D2q. Тогда величина
F _ni + n2-p-l nl4 (Dl-Dl)
Р-Я >, + д2) (я, + «2-2) + n^D*
при выполнении гипотезы Я0 имеет распределение F (р — q, п\ + Щ — Р — !)• Гипотеза отвергается, когда F > (р — q, ni + па — Р — Этот критерий может быть использован в процедуре отбора «наилучшего» набора переменных. Для этого надо в качестве минимума взять малую величину для F-включения (=0.01) и еще меньшую для F-удаления (=0.005). При этом будут отбрасываться только сильно коррелированные переменные. Затем с использованием сводной таблицы работы процедуры следует произвести пошаговую проверку гипотез Я0: А2, = Ар, q = 1, р — 1. «Наилучший» набор признаков получается перед шагом с первым незначимым результатом. Заметим, что этот критерий аналогичен правилу остановки, основанному на использовании величины R2 в пошаговой регрессии. • 2. Как и в случае пошаговой регрессии, пользователь может сам включить определенные переменные в процедуру классификации. После этого пошаговая процедура применяется к оставшимся переменным.
Пример 5.5.1. Пошаговый дискриминантный анализ применялся к подмножеству р = 4 переменных из примера 5.3.3. Были собраны данные о пх = 70 больных из популяции Wx выживших и о щ = 43 больных из популяции W% умерших. Переменными были: Xt — среднее артериальное давление (мм. рт. ст.), Х2 — среднее венозное давление (мм. рт. ст.), Х3 — диурез (см3/ч), Х4 — логарифм индекса объема плазмы (мл/кг). Использовалась программа пошагового дискриминантного анализа с минимумом F-включения = F0.95(l, оо) = 4 и для F-удаления =3.9, т. е. немного меньшим, чем величина порога для F-включения. Соответственно для шагов процедуры, описанных выше, были получены следующие результаты.
Шаг 0. F-включения со степенями свободы 1 и 111 для каждой переменной следующие:
Переменная Хг Х2 Х3 Xt
F-включения 131.41 14.06 22.01 2.49
Поскольку три значения F-включения больше принятого минимума, переходим к шагу 1.
Шаг 1. Переменная Xt выбирается в качестве первой, поскольку она имеет наибольшее значение F-включения. Для каж-
5.5. Пошаговый дискрнминантный анализ
349
дой популяции была получена оценка коэффициента дискрими-нантного уравнения и постоянной:
с,
щ 0.262 -11.627
щ 0.141 -3.383'
Таблица результатов классификации имеет вид
И7! У/г
/«1.35 ..
На первом шаге значение /-"-аппроксимации ?/-статистики, так же как и /-"-включения и /-"-удаления для Хь равно 131.41 с числом степеней свободы 1 и 111. Для Х2, Х3 и Х4 были вычислены значения /-"-включения с 1 и 110 степенями свободы:
Переменная X» Хя Хц ^-включения 10.55 9.52 17.35
Все они больше минимума, поэтому переходим ко второму шагу.
Шаг 2. Поскольку переменной Х4 соответствует максимальное значение /-"-включения, ее выбирают в качестве второй переменной, включенной в процедуру классификации. Оценки коэффициентов дискриминантной функции и постоянные для каждой популяции имеют вид
щ ап с.
Щ 0.690 211.621 -213.956
0.544 199.016 -182.326
Была получена таблица классификации
(.) <
уу2
63 7 6 37
350
Гл. 5. Методы многомерного статистического анализа
/-"-аппроксимация для ?/ равна 84.06 с 2 и 111 степенями свободы. Значения статистики ^-удаления для Хг и Х4 с 1 и ПО степенями свободы приводятся в следующей таблице:
Переменная Х1 Х4 ^-удаления 162.01 17.35
И наконец, для переменных Х2 и Х3 были определены следующие значения /-"-включения с 1 и 109 степенями свободы:
Переменная Х2 Хз ^-включения 9.55 8.97
Шаг 3. а) Теперь Ь = \Хи Х4] и / = 2. Поскольку значения статистики /^-удаления для Хх и Х4, а также значения ^-вклю-чения больше соответствующих минимумов, множество Ь дополняется переменной с наибольшим значением /-"-включения. Таким образом, Ь = \ХЪ Х2, Х4} и I = 3.
Ъ) Оценки коэффициентов линейной дискриминантной функции и соответствующие постоянные приводятся в следующей таблице:
\УХ 0.686 0.126 211.481 -214.141 Щ 0.535 0.324 198.654 -183.557
Таблица классификации имеет вид
УГ1 \У2
67
7
3
36
/•"-аппроксимация ?/-статистики равна 63.58 с 3 и 109 степенями свободы. Значения статистики /^-удаления с 1 и 109 степенями свободы для каждой переменной из Ь приводятся в следующей таблице:
Переменная Хх Х2 Х4 ^-удаления 152.16 9.55 16.24
И наконец, значение статистики ^-включения с 1 и 108 степенями свободы для Х3 равно 7.49.
Шаг 4. а) Поскольку все значения статистик ^-удаления и ^-включения больше соответствующих принятых минимумов, имеем Ь = \Хи Х2, Х3, Х4) и I = 4.
Предыдущая << 1 .. 122 123 124 125 126 127 < 128 > 129 130 131 132 133 134 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed