Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 58

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 52 53 54 55 56 57 < 58 > 59 60 61 62 63 64 .. 183 >> Следующая

0.159 ± 2.10 (0.396) = (—0.673, 0.991), где [V (Ь0)]1'2 = 0.396, а ^0.975 (18) = 2.10. Так как этот интервал включает нуль, гипотеза #о принимается.
Для 95%-ного интервала для среднего значения У при X = 7.7 заметим, что оценка среднего значения У есть у = 0.159 + + 1.227 (7.7) = 9.61. Так как х = 6.7 и 2 (** — *)2 = 526, получаем
Используя формулу (3.1.19), имеем доверительный интервал 9.61 ± 2.10 (0.246) = (9.09, 10.13). Этот доверительный интервал включает истинное среднее значение У при X = 7.7 с доверительным уровнем 95 %.
3.1.3. Проверка адекватности линейной модели
В этом разделе мы обсудим, каким образом проверить адекватность модели простой линейной регрессии. Под адекватностью модели простой линейной регрессии подразумевается, что никакая другая модель не даст значимого улучшения в предсказании У.Пусть, например,'исследователь пожелал проверить, значимо ли улучшается предсказание У с помощью модели полиномиальной регрессии уг = — Ро + рЧ* + Рг*2 + •¦• + $т,хт + ^ для некоторого т=з 2.Нулевой гипотезой в этом случае будет Н0: р2 = ... = рт = 0 (см. разд. 3.2).
Если все п значений хъ х2, хп для X различны (так что не имеется двух значений из У с одинаковым значением X), то можно провести лишь ограниченную проверку адекватности линейной модели (как если бы имелось одно измерение). С другой стороны, если для некоторых значений из X имеется более чем по одному значению из У, то можно проверить гипотезу, что никакая альтернативная модель не дает значимого улучшения предсказания У по сравнению с моделью простой линейной регрессии. Статистика критерия есть еще одно ^-отношение, которое получается из таблицы дисперсионного анализа следующим образом.
Предположим, что имеется & различных значений для X, например хх, Хк- Далее, предположим, что для каждого из этих Х{ имеется щ наблюдений уп, уп, у1щ переменной У,
г = 1.....Пусть щ > 1 для некоторого I, и пусть 2 щ = п.
1.079 У-^ +
(7.7 —6.7)2 526
= 0.246.
(=1
3.1. Линейная регрессия и корреляционный анализ
155
Тогда модель простой линейной регрессии может быть записана в следующем виде:
&/ = Ро + М1 + е(/. / = 1, 1 = 1. • • •, К (3.1.20)
где еи — независимые случайные величины, распределенные по закону N (0, а2).
С помощью программ регрессионного анализа можно получить оценки Ь0 и Ъх для 80 и р\,обрабатывая выборку как п двумерных наблюдений (хъ у1г), (хъуп), (хъ у1п1), .... (хк,ук1), (хк, укг), ... [Хк, Укпк)- В наших обозначениях эти оценки имеют вид
к
Ьо = ?.-М и = -(3.1.21)
?] гц (х1 - *)*
где
У1- = 777-2у"' д-=4-22у"и*=~г2П{Х1' (зл-22)
/=1 (=1 /=1 я=1
Прямая наименьших квадратов есть у = Ь„ + ЬхХ, так что #г = = Ь0 + есть оценка У при X = хг.
Суммами квадратов в таблице дисперсионного анализа являются
SS°=2 2{9i - 9-г и SSr=2 2 - м (3.1.23)
(=1 i=i ¦ i=i /=i
с vD = 1 и vR = п — 2 степенями свободы соответственно.
Для проверки гипотезы об адекватности линейной модели остаточная сумма квадратов SSR и число степеней свободы vR делятся между двумя источниками дисперсии относительно регрессии и внутри групп. Соответствующие суммы квадратов SSA и SSW и степени свободы vA и vw представлены в табл. 3.1.2. Отметим сходство между внутригрупповой суммой квадратов в этой таблице и в таблице однофакторного дисперсионного анализа, рассмотренной в разд. 2.4. Статистика критерия для проверки гипотезы Я0: «простая линейная модель адекватна», против Я,: «простая линейная модель неадекватна», есть
/=¦„ - MSA/MSW, (3.1.24)
где MSA и MSW — соответственно средние квадраты разброса относительно регрессии и внутри групп. В случае истинности #0 величина F0 имеет распределение с vA = & — 2 и vw = n — k степенями свободы. Р-значение есть площадь области под кривой плотности распределения F (vA, vw) справа от F0.
156 Гл. 3. Регрессионный и корреляционный анализы
Таблица 3.1.2
Расширенный дисперсионный анализ для простой линейной регрессии
Источник дисперсии Сумма квадратен а Степени свободы Средний квадрат Р-отношение
Регрессия к »1-= 2 2 (р, -1=1 /=1 \о = 1
Отклонение от регрессии 2 2 (»'¦ -1=11=1 - к)2 VA = ^г — 2 МБА = — р мба
Внутри групп к "[ ssw= 2 2^/-1=11=1 ¦У1-)г vw = n — Vw
к "с
Полная 88т = 2 2 (уч-1=1 1=\ -у-? гт = п — 1
Если Я0 принимается, то остаточная сумма квадратов и степени свободы гк пересчитываются, так что = ББд + + БЗщ. и гк = гЛ + V,,. После этого с помощью Р-отношения, заданного выражением (3.1.11), может быть проверена гипотеза Я0: р\ = 0.
Замечание 3.1.4. Таблица для расширенного дисперсионного анализа может быть получена посредством комбинации выходных данных программы регрессии и дескриптивной программы с расслоением данных следующим образом. С помощью программы регрессии определяем значения ББо, vD, М50, вБу, гк
и гт (см. табл. 3.1.1). Применяя теперь дескриптивную программу с расслоением, стратифицируем значения У, согласно значениям X, и из таблицы однофакторного дисперсионного анализа получим внутригрупповые суммы квадратов 5>5Ш и числа степеней свободы vw. Взяв соответствующие разности, получим = — — SSW и = гк — Эти величины затем порождают табл. 3.1.2.
Предыдущая << 1 .. 52 53 54 55 56 57 < 58 > 59 60 61 62 63 64 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed