Статистический анализ: Подход с использованием ЭВМ - Афифи А.
Скачать (прямая ссылка):
0.9 0.9 3.1 3.2 2.9 2.4
1.1 7.7 33.6 45.3 48.5 52.4
1.0 3.5 9.9 19.3 27.6 33.3
3.7 4.1 10.1 15.2 13.3 9.5
2.7 6.5 27.6 53.4 64.0 61.6
1.9 5.8 33.3 48.1 39.8 22.3
В данном случае время будем считать фактором Ах (фиксированный, 6 уровней), яички — фактором А2 (фиксированный, 2 уровня), а животное — фактором А3 (случайный, 25 уровней). Каждое животное (блок) «делится» на периоды времени (участки), а каждый период — на правое и левое яичко (подучасток) В табл. В приведены полученные факторной программой резуль
Таблица В
Результаты дисперсионного анализа
Источник дисперсии Число степеней свободы р
Животное 23.123 24 0.963 7.4 < 0.001
Время 14.201 5 2.840 21.8 < 0.001
И'1' (ошибка) 15.668 120 0.130 23.6 < 0.001
Яички 1 1 1 <1
Время X яички 19 5 3.8 < 1
Яички X животное 1933 24 80.5 14.6 < 0.001
И (ошибка) 654 120 5.5 — —
Полная 55.599 299
тэты анализа этих данных, преобразованных ранее описанным способом. Эти результаты показывают наличие значимых различий между животными, наличие взаимодействия между яичками и животными (факторы Л2 и А3), а также значимые дифференциальные эффекты времени.
Замечание 4.4.2. Отношение группировки транзитивно. Например, для трех факторов А, В и С это значит, что если фактор В
284 Гл. 4. Дисперсионный анализ
сгруппирован фактором С, а фактор А — фактором В, то фактор А сгруппирован фактором С. Это последнее отношение обозначается А (ВС). Для того чтобы получить сумму квадратов ЭЭ^вс) и число степеней свободы ма (во для А (ВС), используя факторную программу для трех факторов, нужно просто сложить все суммы квадратов и числа степеней свободы, соответствующие источникам дисперсии, содержащим букву А. А именно:
$$а(вс> = ^А -(- ЭБдз -(- 55АС -}- 55АВС,
(во = ^А + vAB + Час + vAвc.
Как и раньше, 55в(о = 5Бв + ББвс- Эта процедура применима к любому отношению группировки Ах (Аа ... Ат).
4.5. Дисперсионный анализ при помощи регрессии
В этом разделе мы обсудим использование программы множественной линейной регрессии для решения всех рассмотренных задач дисперсионного анализа. Это важно сделать, потому что некоторые ПСП содержат программы множественной линейной регрессии и не содержат программ дисперсионного анализа. Не менее важно, что в отличие от факторных программ программы множественной линейной регрессии допускают различное число наблюдений в ячейке. Кроме того, некоторые программы дисперсионного анализа (например, ВМОР2У, МАЫОУА и ВЛШЮУ) используют методы регрессионного анализа, так что этот раздел поясняет методы, лежащие в основе таких программ.
Случай с различным числом повторений в ячейках часто встречается как в планируемом эксперименте, когда некоторые наблюдения пропускаются, так и в непланируемых исследованиях. Например, при обследованиях населения, упомянутых во введении к этой главе, неправдоподобно предполагать одну и ту же численность обследуемых при разных комбинациях уровней социально-экономических и этнических групп.
В этом разделе мы воспользуемся измененной формулировкой задачи дисперсионного анализа в виде общей линейной модели. В частности, мы будем рассматривать все факторы как фиксированные (модель I). В замечании 4.5.3.2 будет показано, что при вычислении таблицы дисперсионного анализа можно обрабатывать случайные факторы как фиксированные. Но при проверке гипотез необходимо вернуться к первоначальной интерпретации факторов.
4.5. Дисперсионный анализ при помощи регрессии
285
Вначале мы рассмотрим технику вычислений для одной гипотезы #0, а затем — для всех гипотез, связанных с полной таблицей дисперсионного- анализа. Грубо говоря, вся техника состоит в переформулировке исходной модели дисперсионного анализа в терминах генерального среднего ц. и минимального множества дифференциальных эффектов, определяемого выбором дополнительных условий. Затем мы представим эту новую модель дисперсионного анализа в форме общей линейной модели. Используя программу множественной линейной регрессии, получим остаточную сумму квадратов и соответствующее число степеней свободы гн для исходной модели. Для проверки гипотезы #0 удалим соответствующие гипотезе переменные из общей модели, вновь пропустим программу линейной регрессии и получим сумму квадратов Б5К и число степеней свободы гн для первоначальной модели при выполнении гипотезы Я0. Статистикой критерия для проверки Н0 служит
(55н-53н)/(ун-ук)
Эта статистика, уже рассматривавшаяся в разд. 3.2 и 4.1, подчиняется Р-раСПреДелеНИЮ СО СТепеНЯМИ СВобоДЫ Ун = — ун
и Р-значение равно площади справа^от точки Р под кривой плотности распределения Р (гн,
Проверка заданной гипотезы #„ о дифференциальных эффектах проводится в несколько шагов.
Шаг 1. Выписать исходную модель дисперсионного анализа с фиксированными эффектами и дополнительные условия на дифференциальные эффекты.
Шаг 2. Используя дополнительное условие, представить один из участвующих в нем эффектов в виде линейной комбинации других. (Например, если фактор А определяет эффекты аъ а/(
а дополнительное условие имеет вид аг + а2 Н-----1- а7 = 0, то