Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 126

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 120 121 122 123 124 125 < 126 > 127 128 129 130 131 132 .. 183 >> Следующая

•0.0 QI 02 Q3 0.4 05 06 07 0.8 09 1 О Рг
J-1-\-1-1-1-1---J-_.j----1-у
-СО -095 -0.60 -0.37 -aiB -О.О 0.13 0 57 060 0.Э5 CO /
Рис. 5.4.1. Номограф, отражающий зависимость между г и Pr(W2|x).
Величина log [Pr (х} | №2)/Pr (х} \ W^] является весом, соответствующим предикторной переменной X/, который может быть оценен по выборке из популяции детей с маленьким весом при рождении, /= 1, р. Постоянная log (<?2^i) оценивается по той же выборке.
По ретроспективно собранным данным о 117 младенцах были найдены байесовские веса и постоянные для р = 9 значимых предикторов PDI (значимость оценивалась посредством критерия х2) (см. табл. А). По этим данным априорная вероятность нормального развития ^ = 0.71, а ненормального <?2 — 0.29.
Таблица А
Байесовские веса
Переменная Значение Вес
Осложнения Нет —0.111
беременности Есть 0.233
Вес ребенка при рождении >1000 г —0.092
< 1000 г 0.460
Сокращение срока беременности 10% —0.049
в % от нормы < ю% 0.505
Дыхание Нет —0.150
Есть 0.270
Фототерапия Нет —0.324
Есть 0.092
Переливание крови Нет —0.303
Есть 0.132
Хирургическое вмешательство Нет —0.054
Есть 0.623
Инфекция Нет —0.162
Есть 0.338'
Врожденная болезнь сердца Нет —0.264
ч Есть или 0.186
подозре-
вается
Постоянная — —0.389
344
Гл. 5. Методы многомерного статистического анализа
Таблица В
Пример
Переменная Значение Вес
Протекание беременности Ненормаль- —0.111
ное
Вес ребенка при рождении < 1000 г 0.460
Сокращение срока беременности <С 10% 0.505
в % от нормы
Дыхание Есть 0.270
Фототерапия Нет —0.324
Переливание крови Нет —0.303
Хирургическое вмешательство Есть 0.623
Инфекция Нет —0.162
Врожденная болезнь сердца Нет —0.264
Постоянная — —0.389
Для использования этой модели требуется сложить веса, соответствующие данным х рассматриваемого младенца, и найти точку, соответствующую полученному значению суммы на номо-графе рис. 5.4.1. Например, для младенца, данные которого приведены в табл. В, г = 0.305. По номографу Рг (№2 | х) составляет около 0.70. Это больше 0.5 и для такого ребенка будет предсказано ненормальное психомоторное развитие.
5.5. Пошаговый дискриминантный анализ ^
В разд. 5.3 и 5.4 рассматривался случай отнесения р-мерного вектора наблюдений х -•= (хи хр)' к одной из k популяций Wt, объекты которых имеют многомерные нормальные распределения A/(lipx1, ?рХр), где Ii,- = (цЛ.....ixip)', i = 1, k. Поскольку х служит реализацией случайного вектора X = (Хъ ...
Хр)', для разделения k популяций до сих пор использовались все переменные Хх, Хр. Однако на практике часто требуется выявить такое гюдмножество этих переменных, по которому можно построить «наилучшёеГразделение k популяций. Можно провести аналогию с пошаговой регрессией (разд. 3.3), где требуется определить подмножество независимых переменных, «наилучшим образом» предсказывающих зависимую переменную Y. Для этого в регрессионном анализе можно воспользоваться F-статистикой, построенной на основе частных корреляций. В дискриминантном анализе F-статистика для отбора переменных основывается на
5.5. Пошаговый днскримннантный анализ
345
критерии однофакторного дисперсионного анализа. В обоих, случаях /-"-статистика называется «^-включения» переменных, не вошедших в искомое подмножество и «/-"-удаления» выбранных переменных.
В суту<пст1^пг^^ипи1ягавагп анализа тЛ1Шва^-Вначаде-переделаете я„пepeJ^jiнj^я,._ Для котг^то^^тедни^^нячения в АмйЩЛ я -циях «наиболее различны». Для каждой переменной различие измеряется' с" помощью ^"-статистики одао^шкторного дисперсионного анализа и выбирается {яш^ключаётсяТ~1& переменная, которой соответствует наибольшее значение Т7. На каждом шаге процедуры рассматривается условное распределение каждой переменной, не включенной в подмножество, при заданных включенных переменных.
Из числа не включенных переменных определяется переменная, для которой средние значения условных распределений в к популяциях «наиболее различны». Это различие измеряется с помощью /-"-статистики однофакторного дисперсионного анализа. Процесс завершается, когда ни^эдна из оставзцяхся переменных не вносит значимого вклада в разделение к популяций. Как и в пошаговой регрессии, пользователь выбирает допустимый минимум г7-включения, соответствующий максимальному уровню а (стандартное значение равно 4.0) и минимум /-"-удаления (стандартное значение равно 3.9), причем минимум ^-удаления должен быть меньше, чем-лщщдмум /-"-включения.
Рассмотрим пошаговую процедуру более подробно. Пусть х^*1, Хсп* — случайная выборка из I = 1, Тогда,
используя обозначения и определения разд. 5.4, можно описать пошаговую процедуру следующим образом.
Шаг 0. Для каждой переменной Х}, у = 1, р, аналогично /-"-статистике для проверки гипотезы Я0: р17- = • • • = р^- в одно-факторном дисперсионном анализе вычисляется статистика /-"-включения ей — 1 яп — & степенями свободы. Если все значения /-"-включения меньше принятого минимума, то считается, что ни одна переменная не вносит весомого вклада в разделение популяций. _^ ?
Предыдущая << 1 .. 120 121 122 123 124 125 < 126 > 127 128 129 130 131 132 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed