Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 87

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 81 82 83 84 85 86 < 87 > 88 89 90 91 92 93 .. 183 >> Следующая

(У\ — Уг) ± * 1 _ <а/2) (»1 + «2 - 2) |/ 4 ("„— + ) • 4.1.3. Проверка гипотез
В большинстве задач дисперсионного анализа проверяемую гипо тезу можно записать в виде Я0: 9,- = 0,- = ... = 0,-т = 0, т. е. как гипотезу о том, что т из р параметров равны нулю. Не теряя общности, можно считать, что речь идет о последних т параметрах. Итак, запишем нулевую гипотезу: Я0: 0„_т+1 = ... = = 0Р = 0. Сформулируем критерий отношения правдоподобия для проверки этой гипотезы. Для этого выпишем усеченную модель
у і = «л*
¦е(,
1 = 1,
га. (4.1.12)
Такую форму принимает наша общая линейная модель с учетом гипотезы Я0. Затем найдем МНК-оценки 0г, Ьр_т для пара-
4.1. Основы теории общей линейной модели
231
метров 9Ь 9р_т. Остаточная сумма квадратов при принятии гипотезы #0 есть
п
= I] (У{ - В&ц-----вР-тхр-т, О2, (4.1.13)
! = 1
а v'ц — соответствующее число степеней свободы. Поэтому статистика критерия правдоподобия имеет вид
р= (33,-33 )/^-^ .
а Р-значение равно площади справа от точки под кривой плот-ностл распределения Б (гк —гк). Величина Б8Н = 5БК — 5БК называется гипотетической суммой квадратов, г \н = \'я — ук — гипотетическим числом степеней свободы. [Как и прежде, 5БК — остаточная сумма квадратов (сумма квадратов ошибок), а чя — остаточное число степеней свободы. ] Сумма ББр служит мерой того, насколько хорошо усеченная модель согласуется с наблюдениями. Ясно, что ББр ^ ББр. Поэтому ББн показывает, насколько хуже наблюдения аппроксимируются усеченной моделью, а р есть мера потерь при принятии гипотезы #0 по сравнению с согласием в исходной модели. Чем больше р, тем хуже усеченная модель. Следовательно, при больших значениях Р нужно отклонить гипотезу Н0.
В таблицах АМОУА кроме ББр, гн и МБд может фигурировать и статистика критерия Р, называемая В'-отношением. Мы еще встретимся с такими таблицами в этой главе.
Замечания 4.1.3. 1. То, что величина Р, задаваемая равенством 4.1.14, подчиняется ^-распределению, вытекает из результата, известного как теорема Кокрэна. Приведем ее формулировку.
Теорема Кокрэна. Рассмотрим общую линейную модель, описываемую соотношением (4.1.2) при условиях (4.1.3) и (4.1.8). Пусть 5г —суммы квадратов с гг степенями свободы1), I = 1, ч
Если величина 5 = 2 ^ распределена как сг2%2 (\) н гг -I- • -• 1=1
... + V, = V, то
a) суммы 5г распределены как а2%2 (V;), I = 1, д,
b) все суммы 5Х, независимы.
х) 'Аг Сумму квадратов 5; можно записать в виде у'Ау, где у"х — вектор наблюдений, а \пхп — известная матрица. При такой записи число степеней свободы 5,- определяется как ранг матрицы А.
232
Гл. 4. Дисперсионный анализ
Из раздела 1.2.8 приложения мы знаем, что если отношение Sj/a2 имеет распределение %2 (v,), а S^/a2 — распределение %2 (vj)
и величины S, и Si независимы, то статистика F — f'{Vf подчи-1 1 Sj/vj
няется распределению F (vt, v}).
2. Можно показать, что сумма SSR распределена как а2%2 (vr).
А поскольку SSR = SSR + SSH и vR = vR + vH, то
a) сумма SSR распределена как а2%2 (vR), а SSH — как а2%2 (vH),
b) величины SSR и SSH независимы. Поэтому отношение F =
= sSr/v" имеет РаспРеДеление F (vH, vR).
Пример 4.1.1 (продолжение). Для модели простой линейной регрессии
SSR = S (ус - ?0 - М,)2 = S (г/,- - у)2 - ?2 S (ж, - х)2.
При выполнении нулевой гипотезы Н0: ?i = 0 усеченная модель представляется в виде yt = ?0 + et, так что ?0 = у и
SS'R= S(y(-?o)2= S (г/(-У)2-
i=i i=i
Числа степеней свободы суть vR = п — 2 и vR = п — 1. Поэтому гипотетическая сумма квадратов запишется в виде
SSH = (SSR - SSR) = ?2 ? (xt - x) 2.
;=i
Отсюда
Р2 |(^-^)2/1 Р=-- „ '~'--, где р, = Р0 + М«-
2] (Л - ^>)2/(" - 2) (=1
Это та же самая статистика, которую мы использовали в (3.1.11). Пример 4.1.2 (продолжение). В этом случае имеем 85в=2 0,1.-й)а+ Е (Уг-У*?.
4.1. Основы теории общей лниейиой модели
233
При гипотезе #„: ^ = [х2 = ц х) усеченная модель задается соотношением tji = д. + еи i = 1, п. Соответствующей оцен-
п
кой для д. служит Д = г/ = (1/п) S г/г, так что
SSr = 2 (у,- - у)2 = ? {у, - yif + 2 & - У*)2+
(=1 1=1 i—nt+l
Число степеней свободы VR = «! + Пг — 2 и vR = п± + п2 — 1. Отсюда для гипотетической суммы квадратов получаем
SSH = (SSr — SSR) = {ПхПъКпг + п2)) (ух — z/2)2> р = ("1»2/(»1 + п2)) (ух — у2)% _ (ух — у2)а = р
4 4 (1/Я1 + \щ2)
' где f — двухвыборочная f-статистика.
Резюме
В этом разделе мы описали общую линейную модель как единую теоретическую основу и дисперсионного, и регрессионного анализов. Все конкретные модели дисперсионного анализа, которые мы будем далее рассматривать, можно записать в виде линейной модели. Поэтому теорию общей линейной модели можно применить к любой конкретной модели ANOVA. Итак:
1. Метод наименьших квадратов является оптимальным методом оценивания параметров моделей дисперсионного анализа. Он приводит к несмещенным оценкам, обладающим наименьшей дисперсией среди всех несмещенных оценок, линейно зависимых от наблюдений.
2. В любой модели дисперсионного анализа в таблице ANOVA приводится обычная несмещенная оценка дисперсии ошибок а2, задаваемая средним остаточным квадратом MSR. Иногда для этой
Предыдущая << 1 .. 81 82 83 84 85 86 < 87 > 88 89 90 91 92 93 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed