Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
перев.
3 Пусть и хг — результаты измерений в двух различных лаборато-
риях. Ш предположению, хг и а» — независимые нормальные величины с дисперсией о-2, поэтому разность хг — хг распределена нормально с нулевым средним и дисперсией 2<г2. Таким образом, Р (|— х2|>1,5я) = = 2[1 —Ф(1,5в/<г \2)]. Согласно предыдущей сноске, с вероятностью 0,975 имеет место неравенство а/о-<1,1, поэтому Pd^ — х2 | > 1,5а) > > 2 [1 — Ф(1,5 ¦ 1,1/1,41)] — 2 [1 —Ф(1,17)] 0,24. Полученный результат
позволяет с вероятностью 0,975 утверждать, что не менее чем в четверти всех случаев результаты измерений в двух различных лабораториях будут отличаться друг от друга более чем на 1,5а. — Прим. перев.
296 Гл. XI. Проверка гипотез с помощью статистических критериев
отклонения результатов различных лабораторий получилась оценка S = = 1,4.
Сравнение с более точными методами измерений показывает, что систематическая ошибка «метода сжигания» ужасающе велика н достигает 2.6. Следовательно, метод сжигания А не очень надежен.
§ 58. Дисперсионный анализ
А. ДИСПЕРСИЯ ВНУТРИ КЛАССОВ И МЕЖДУ КЛАССАМИ
Пусть хи . . ., хп, ух,. . ., уп и zu . ... zn — независимые, нормально распределенные случайные величины, причем все х,-наблюдаются в одинаковых экспериментальных условиях, и поэтому можно предположить, что ж,- имеют одинаковые средние значения и одинаковые дисперсии. Точно такие же предположения мы будем делать относительно уу и zk. Далее, предположим, что все х{, уj и zk имеют одинаковую'дисперсию сг2 (эту гипотезу можно проверить с помощью критерия F). Возникает вопрос, одинаковы ли средние значения у х{, уу и zA?
Для ответа на этот вопрос можно использовать метод дисперсионного анализа. Идея этого метода основана па том, что если х, у и z имеют одинаковое среднее значение, то общая сумма квадратов
Q = 2 (х — МУ + 2 (у — МУ + 2 (г — MY’ (О
где М — общее выборочное среднее значение всех x[t у} и zk, распадается на две составные части, из которых первая связана с оценкой дисперсии внутри трех классов, а вторая — с оценкой дисперсии между классами. Эти две составные части сравниваются затем друг с другом посредствсм критерия F.
Математическим вспомогательным средством, позволяющим получить такое разложение, является ортогональное преобразование. Введем вместо хи . . ., хп новые переменные щ,. .., ип,
из которых первое пропорционально арифметическому среднему х:
u1 = ^±-^±^^-xU, (2)
\п
а остальные переменные и2,. . ., ип определяются таким образом, чтобы преобразование было ортогональным. Тогда, в силу ортогональности,
V а? = У1 и>- = иг _|_ _ . + игз (3)
следовательно,
и\ + . . . + и\ = ? х2 — vl = ^ х2 — пх2 = ^ (х— х)2. (4)
§ 58. Дисперсионный анализ
297
Таким образом, данная часть суммы квадратов соответствует дисперсии в классе всех х.
Точно так же, заменив ух, . . уп и zx, . . ., zn новыми переменными vx,. . ., vn и wx,. .., wn, получим
v\ + . . . -j- v2 = ? {у — у)2. (5)
и2 4- . . . -f- и2 =2 (z z)-. (6)
Складывая (4), (5) и (6), найдем
& = (“! + •••+“«) + (*>! + ••¦+ vl) + («•'! -г • • . + =
= 2 (х — х)2 + 2 (у — у)2 + 2 (z —2)2- (7)
Сумму квадратов Q2 можно использовать для оценки дисперсии внутри классов. Как всегда, такой оценкой является
^ = 3^- <8>
Если три класса состоят из различных количеств наблюдений Пу, щ, щ, то вместо (8) получится формула
о _ ___________Q2____________
2 (ni — 1) 4- (w2 —1)4- (п3 — 1)
или, короче,
s%='N — 2> (9)
где N = пх 4- п2 + п3.
Для того чтобы найти «дисперсию между классами», их, vx, и\ подвергают новому ортогональному преобразованию, при котором они переходят в и', v', w', где и' пропорционально общему выборочному среднему М всех xt, yj и zk\
(10>
и' = M]f N = + + __ Ц1 Ущ 4- г>д Уп2 4- и-i }'эт3
Yn Y'n
В силу результатов § 13, такое преобразование возможно, так как сумма квадратов коэффициентов в правой части (10) равна единице:
Щ. | Щ , П3 I
N ^ ^ N
Так как преобразование ортогонально, то
их -j- vx - и\ ~ и’2 -j- V2 4- w'2 . (] ])
Поэтому, ПОЛОЖИВ V'2 4- w'2 = Qlt получим
Qi = и\ т v\ + и-i — и'2 = и\ 4- vf + — NM’2-. (12)