Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
Если хотят проверить простую гипотезу II и если альтернатива II' также является простой, то, как мы видели в § 59, для проверки Н всегда существует критерий, являющийся наиболее мощным относительно альтернативы Н'. Но если Н' является сложной, то могут иметь место два случая: либо существует равномерно наиболее мощный критерий, относительно всех простых гипотез, содержащихся в И', либо такого критерия не существует.
Пример 42 (§ 59) может служить иллюстрацией обоих случаев. В этом примере гипотеза II является простой и гласит, что все
316 Гл. XI. Проверка гипотез с помощью статистических критериев
независимы и распределены нормально с нулевым средним значением и единичной дисперсией. Альтернативная гипотеза Н' зависит от параметра а и поэтому является сложной; согласно этой гипотезе, х{ независимы и распределены нормально со средним значением а и единичной дисперсией. Если допустимы лишь положительные значения а, то существует равномерно наиболее мощный критерий: гипотеза II отвергается тогда, когда
х превышает cffn. Но если допустимы также и отрицательные значения а, то равномерно наиболее мощного критерия не существует. Критерий, отвергающий большие значения х. теряет свою мощность при отрицательных а, и критерий, отвергающий малые значения х, не является наиболее мощным при положительных а.
Для того чтобы в подобных случаях хорошие критерии можно было отличать от менее хороших, вводится понятие несмещенности. Критерий для проверки простой гипотезы И называется несмещенным, если вероятность отвергнуть Н, когда она верна, не превосходит вероятность отвергнуть И, когда верна одна из гипотез II', т. е.
p(F|2?) ¦=? p(F|2Z') для всех Н'. (1)
Другими словами, вероятность отвергнуть гипотезу II, когда она правильна, не должна превосходить вероятность отвергнуть И, когда Н ложна. Вполне разумное требование!
Если в примере 42 расширить гипотезу Н' и считать допустимыми все положительные и отрицательные средние значения а, то односторонние критерии, которые отвергают гипотезу Ы, коль скоро х > c/fn или коль скоро х < — с/Уп, не будут несмещенными. Для того чтобы получить несмещенный критерий, нужно воспользоваться абсолютной величиной | х j и определить критическую область с помощью неравенства | х | > c'j^n. Если с' выбрать таким образом, чтобы вероятность отвергнуть гипотезу Н, когда она правильна, в точности равнялась ;3, то этот критерий будет несмещенным, наиболее мощным критерием относительно всех альтернатив Н'. Доказательство1 можно найти в работе: Neyman J. and Pearson Е. S., On the problem of the most efficient tests of statistical hypotheses, Philos. Trans. Royal Soc., London, A 231 (1933).
Если гипотеза II также является сложной, то и задача становится сложнее. Пусть, например, согласно гипотезе К, случайные величины х1г. . ., хп предполагаются независимыми и одинаково нормально распределенными с нулевым средним зна-
1 Это доказательство приводится в книге Крамера Г., Математи ческие методы статистики, ИЛ, М., 1948, стр. 581. — Прим. перев.
§ 60. Сложные гипотезы
317
чением и произвольным (незаданным) квадратичным отклонением сг. Если гипотеза Н верна, то совместная плотность вероятности для xlt . . ., хп задается формулой
— —-----(Xе 4- I . I 4- X* ) *
f(x\cr) = (2ncr) 2 е 2"* * • (2)
Пусть V — критическая область. Если наблюденная точка
X принадлежит F, то гипотезу II следует отвергнуть. При этом вероятность ошибки первого рода
Р(К1°") = | /(* I(Г) dV> (3)
V
вообще говоря, зависит от сг. Если P(F | сг) р для всех о-> О, то говорят, что уровень значимости критерия или области V не превосходит р. Если же для всех а-
p(F ] о-) = р,
то говорят, что критерий (или область V) имеет уровень значимости, в точности равный р. В этом случае Нейман и Пирсон называют F областью, подобной пространству выборокг.
Нейман, Шсффе и Лсманн2 разработали общие методы, позволяющие находить области V с уровнем значимости, в точности равным р. Сущность этих методов мы поясним с помощью только что сформулированного примера. Доказательства можно найти в соответствующей литературе.
Формула плотности вероятности (2) непосредственно показывает, что
Q = х\ + . . . + хгп (4)
является достаточной оценкой для по-2. Плотность распределения случайной величины Q равна
п _______1_
д(и | о-) = С сг~~п и2, е 2 , где С =-------——_ /54
Однопараметрическое семейство функций д(и | сг) образует ограниченно-полную систему, в смысле Леман на и Шеффе; это
1 Пространство выборок Е удовлетворяет равенству РСЕ|сг) = 1 при всех сг. — Прим. перев.
2 См. прежде всего Lehmann and S с h е f f ё, Completenes, Similar Regions and Unbiased Estimation, Sankhya, 10 (I960), 306 и 16 (1956), 219. Там же указана дальнейшая литература.