Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
Построение критерия для проверки гипотезы Н0 эквивалентно указанию критической области V, включающей в себя некоторые из п\ перестановок. Если наблюденное расположение принадлежит области V, то гипотезу Н0 следует отвергнуть. Для того чтобы уровень значимости этого критерия не превосходил /3, нужно, чтобы область V содержала не более чем /Зи! перестановок.
Критерий Смирнова аналогичен критерию Колмогорова (§ 16). В критерии Колмогорова сравнивались эмпирическая и предполагаемая теоретическая функции распределения. В критерии Смирнова сравниваются две эмпирические функции распределения.
Пусть Fg(t) — эмпирическая функция распределения, построенная по выборке хи. . ., xg. Если k(t) — количество тех xt, которые удовлетворяют неравенству xt < t, то
Точно так же пусть Gh(t) — эмпирическая функция распределения, построенная по выборке ylt. . ., yh, и пусть D — верхняя грань разности \Fg — Gh \. Согласно критерию Смирнова, гипотезу Н0 следует отвергнуть, если D > D„. При этом определяется так, чтобы вероятность события D > Dp, когда гипотеза Н0 верна, не превосходила р.
Смирнов доказал1, что вероятность события
1 Смирнов Н. В., Оценка расхождения между эмпирическими кривыми распределения в двух независимых выборках, Бюлл. МГУ, 2, вып. 2 (1939), 1.
Б. КРИТЕРИЙ Н. В. СМИРНОВА
32S
Г л. XII. Порядковые критерии
при больших п асимптотически равна сумме бесконечного рядг 2е-2*2 _ 2е-22.и.2 + 2е~*‘-'а? — . (1)
Следовательно, если А определить таким образом, чтобы сумма этого ряда равнялась 2(5, то при больших п можно будет положить
<2»
Ряд (1) сходится очень быстро, и для практических целей его сумму можно заменить первым членом: это лишь увеличит надежность критерия. В результате получаем очень полезное приближение
Л ~|/-J ln/З. (3)
Для того чтобы найти хорошее приближение для Dp, нужно лишь (3) подставить в (2).
Особым преимуществом критерия Смирнова является то, что этот критерий со сколь угодно большей вероятностью позволяет обнаружить любое отклонение между функциями распределения х и у, если только га достаточно велико. Таким образом, критерий Смирнова следует применять тогда, когда нужно проверить полное согласие функций распределения F(t) и G(t) случайных величин х и у во всем интервале изменения t и когда для этой проверки в нашем распоряжении имеется очень обширный материал наблюдений.
Но если речь идет лишь о том, чтобы установить, не будет ли
х в среднем больше, чем у, то следует^рименять более мощные критерии, которые даже при небольших п могут привести к решению поставленного вопроса. Такого рода критериями являются критерий Вилкоксона и критерий X, к изложению которых мы теперь и переходим.
§ 63. Критерий Вилкоксона
А. ФОРМУЛИРОВКА КРИТЕРИЯ
Пусть наблюденные х( и ук расположены в порядке возрастания их величины. Если отбросить индексы, то получим последовательность, состоящую из букв хну, например,
уухухуухх. (1)
Если в этой последовательности х появляется позднее некоторого у, то говорят, что имеется одна инверсия. Например, последовательность (1) содержит 15 инверсий, так как первый а; образует
§ 63. Критерий Вилкоксона
329
с двумя предшествующими у две инверсии, второй ^образует три инверсии и оба последних х — по пять инверсий.
Согласно критерию Вилкоксона, нулевая гипотеза отвергается, коль скоро количество инверсий U превосходит границу Up. Граница Up выбирается таким образом, чтобы, в случае если нулевая гипотеза верна, количество перестановок с числом инверсий U > Up не превышало /8 п\. Указанное правило представляет собсй односторонний критерий.
При малых g и h граница Up определяется непосредственным подсчетом последовательностей с наибольшими количествами инверсий. Для облегчения этого подсчета можно у х и у так же, как в (1), отбросить все индексы. В этом случае количество всех возможных последовательностей будет равно не п\, а
которая имеет gh инверсий. Затем записывают последовательность
с gh — 1 инверсиями и т. д. — до тех пор, пока не наберется больше
из полученных последовательностей и принимают в качестве Up. Проиллюстрируем этот метод следующим примером:
Последняя из выписанных последовательностей имеет 22 инверсии, следовательно, U0i02s = 22.
В данном случае существуют лишь 4 последовательности с большим чем 22 количеством инверсий, а именно последовательности с 1 по 4. Таким образом, уровень значимости соответствую-
п
п\
9
g! А!