Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 71

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 65 66 67 68 69 70 < 71 > 72 73 74 75 76 77 .. 183 >> Следующая

0.778 —0.871 (0.839) 1А1 — (0.871)2 ]А 1 — (0.839)2
0.204,
Г— ,а. .„ ,г. .„ „.^ттг- — и. I / /,
= 0.967 - 0.927 (0.839) = 0
Гх'х'-Х1 У1 _ (0.927)2 V1 - (0.839)2 где обычные коэффициенты корреляции
^, = 0.871, гуя, = 0.778, г№ = 0.845, г,„, = 0.839, = 0.927, ' гх,х, = 0.967
взяты из корреляционной матрицы примера 3.2.2 (с У = Х4). Итак, имеем
' ухг-Х^в
V ' Гух3-Х1 V ' гл:2*з-*1
__0.177-0.204 (0.927) = __0 0дд
_ V1 — (0.204)2 VI - (0.927)2
Доверительные интервалы для р^.*,*, можно получить, воспользовавшись номограммой из табл. 9, приложение II, и заменив п на п — & = 139. Так, 95 %-ным интервалом будет интервал <—0.19, 0.14).
Необходимо отметить, что частная корреляция между У и Х3 при фиксированном Хх невелика. Аналогичный вывод можно сделать и при замене Х3 на Х2. С другой стороны, когда значение Хх фиксировано, переменная Х2 сильно коррелирует с Х3. Все эти результаты находятся в согласии с клиническими наблюдениями.
Пример 3.2.4. В этом примере приводится интересное приложение множественной регрессии для оценки состояния здоровья индивидуума. Зависимой переменной У служит возраст (в годах), используемый как показатель состояния здоровья. Индивидуумы, для которых предсказанное значение возраста меньше хронологического, считаются более здоровыми, чем обычно, а те, которых предсказание сделает старше, менее здоровыми. Независимыми переменными являются Хх — среднее диастолическое давление
3.2. Множественная линейная регрессия и коррелицни
189
(мм рт. ст.), Х% — концентрация холестерина сыворотки (мг %), Х3*— наличие изменений в электрокардиограмме (0 — отсутствуют, 1 — имеются), Х4 — результат рентгеноскопии грудной клетки (сколько рентгенологов из трех (0, 1,2 или 3) сочли рентгенограмму ненормальной), Хъ ¦— варикозность (0 — норма, 1 — варикозное расширение вен на одной или обеих ногах), Хв — наличие периодентоза (0 ¦— отсутствует, 1 — слабовыраженный гингивит, 2 — гингивит, 6 — гингивит с образованием пазух, 8 — выраженная деструкция). (О деталях этого исследования см. АЬгапатэе, КдэсЬ (1975)). Заметим, что наличие независимых переменных как дискретного, так и непрерывного типов, не противоречит общим предположениям модели линейной регрессии.
Во вспомогательной таблице содержатся средние значения +5(1 переменных Хх, Хв и их корреляции с У, полученные ло выборке, состоящей из 5313 индивидуумов
Случайная величина Среднее ± 5(1
У 39.2 ± 14.1 -
х, 78.3 ± 12.9. 0.36
214.8 ±48.0 0.43
х, 0.22 ± 0.42 0.22
1.02 ± 0.87 0.23
0.17 + 0.37 0.34
11.6 ± 16.7 0.34
Используя табл. 9, приложение II, получаем, что для всех шести независимых переменных коэффициенты корреляции с У значимо отличны от нуля (Р <С 0.01), хотя их п°личина невелика. МНК-уравнение регрессии имеет вид
у = 0.218*1 + 0.093х2 + 4.054*3 + 2.670х4 +
+ 8.879х6 + 0.161 х0 — 4.722.
Множественный коэффициент корреляции равен 0.64, следовательно, объясненная доля дисперсии переменной У составляет 41 %. Согласно замечанию 3.2.4.6, из другой интерпретации этого коэффициента следует, что не менее чем (1 — 0.41)1/2 = 0.77 стандартного отклонения У осталось необъясненным.
Значения ^-статистики для проверки гипотезы Н0: рг = 0 суть 18.2, 29.0, 11.2, 15.6, 21.9 и 17.7 для г = 1, 6. Все эти величины значимы с Р < 0.001. Поэтому ни одна из переменных не может быть удалена как бесполезная для анализа.
Из приведенного выше уравнения для у следует, что [) увеличение диастолического давления на 1 мм рт. ст. приводит к увеличению кажущегося возраста на 0.22 года, п) увеличению концентра-
190
Гл. 3. Регрессионный н корреляционный анализы
ции холестерина сывороток на 1 мг % соответствует увеличение кажущегося возраста на 0.09 лет, ш) наличие изменений в ЭКГ дает увеличение кажущегося возраста на 4 года, 1у) увеличение на единицу числа рентгенологов, находящих изменения в состоянии грудной клетки, увеличивает кажущийся возраст на 2.7 года, V) наличие варикозного расширения вен добавляет к кажущемуся возрасту 8.9 лет, VI) каждый балл показателя периодентоза увеличивает возраст на 0.16 лет.
3.2.6. Дополнение к анализу остатков
В разд. 3.1.5 рассматривалось использование графиков остатков &1 — — У г в зависимости отХг или у( (1 = 1, п) для проверки предположений модели простой линейной регрессии. Аналогичные графики могут быть построены и в случае модели множественной линейной регрессии. Однако здесь можно получить значительно больше графиков, поскольку остатки можно сопоставлять с каждой из р независимых переменных. В соответствующих программах некоторых ПСП имеется возможность вывода графика с(г- в зависимости от уг. Тогда, если все предположения линейной модели регрессии выполнены, коэффициент корреляции между этими двумя переменными будет равен (руХ1...ХрУ/2 и, следовательно, нельзя ожидать график в виде случайной горизонтальной полосы. График 4 в сопоставлении с хи (г = 1, л, / = 1, р) содержит информацию о 1) наличии аномальных наблюдений или случаев отклонений по /-й независимой переменной, и п) возможном отсутствии линейности по Х}, что может служить указанием для дальнейшего преобразования. График а\ относительно #г (г = 1, п) доставляет информацию о выполнении предположений случайности и независимости ошибок е{, а также и предположения о гомо-скедастичности ег. Некоторые программы позволяют получить и график с1г в нормальной вероятностной шкале (см. разд. 1.7.3), который очень полезен для проверки предположения о нормальности ег. Наконец, для анализа остатков иногда вычисляется и печатается статистика Дурбина—Ватсона
Предыдущая << 1 .. 65 66 67 68 69 70 < 71 > 72 73 74 75 76 77 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed