Статистический анализ: Подход с использованием ЭВМ - Афифи А.
Скачать (прямая ссылка):
Замечания 1.5.1. 1. Предположим, что X распределена по закону N (р., а2) с известной дисперсией о2, и значения хъ хп— случайная выборка из этого распределения. Рассмотрим проверку гипотезы Н0: р = р0 против односторонней альтернативы Ях: Р > Ро с уровнем значимости а. Критическая область для наилучшего критерия определяется условием х - хи, где х == (1/л) X
п
X Jjxi — выборочное среднее, а хи выбрано так, что Рг(х^
^ хи | #о) = а. Поскольку из замечания 1.4.1.1 мы уже знаем, что при выполнении #0 величина х имеет распределение N (р0, ог1п), то хи = р0 + zL_a (а/1/ п), где z^a есть 100 (1 — а)-я процентиль распределения N (0, 1). Следовательно, критической областью будет правый хвост (х хи) (рис. 1.5.2, а).
Аналогично для проверки гипотезы Я0: р. = р0 против другой односторонней альтернативы Ях: р <^ р0 наилучший критерий дает в качестве критической области левый хвост, а именно х < < xt = ро + za (а/|/ п) (рис. 1.5.2, Ь). Эти критерии называются односторонними.
438
Приложение I. Обзор основных понятий
Наконец, для проверки гипотезы Я0: р. = р.0 против двусторонней альтернативы Нг: ц. Ф р.0 критерий отношения правдоподобия дает в качестве критической области оба хвоста одновременно:
_ . а . а
X < Ха = Ц0 +- 2«/2 г— И X > Хь — Но ~Г 21 — (а/2) ,/-—
(рис. 1.5.2, с). Этот критерий называется двусторонним. Отметим, что оба односторонних критерия обладают тем свойством, что их мощность против любого значения р, которое возможно при выполнении Яь максимальна. Критерий, наилучший для всех альтернатив, называется равномерно наиболее мощным.
с
Рнс. 1.5.2. Критические области для проверки гипотезы Я0: р, = щ при заданной дисперсии о2, а — альтернатива #і: р, > іц; 6 — альтернатива #х: р, < |Хо1 с — альтернатива //х: щ.
2. Легко вычислить мощность каждого из критериев в замечании 1.5.1.1. Для альтернативы Ях: р. = р,х > р0 получим где 2 распределена как N (О, 1); для альтернативы Ях: р, =
1.5. Проверка гипотез
439
= (д.А <^ (х0 получим
я = Рг (г < гп - // п ) ,
и, наконец, для альтернативы Нх: ц = р,х ^= ц.0
я^Рг^гь/а-^'^Уп ) + Рг (2<2«/2 +
(м-1 — Ы
ст
3. Каждая из [альтернатив, фигурирующих в замечании 1.5.1.2, указывает одно значение ц., т. е. ц. = цх. Гипотеза, однозначно указывающая значения каждого параметра, называется простой. Если гипотеза не конкретизирует значения некоторых параметров, она называется сложной. Каждая из альтернатив в замечании 1.5.1.1 — сложная.
4. Следует иметь в виду, что заключение, получаемое при любой статистической проверке гипотезы, может быть ошибочным. В частности, принятие нулевой гипотезы Я0 не должно приводить к выводу, что #0 действительно верна. В любом случае результат статистической проверки следует рассматривать только как один из факторов, влияющих на окончательное решение. Другими факторами должны быть опыт и интуиция исследователя.
1.5.2. Понятие о Я-значении
В большинстве случаев критические области критериев выражаются через некоторую статистику называемую статистикой критерия. Статистика критерия выбирается обычно так, чтобы при условии правильности нулевой гипотезы можно было получить ее распределение в табулированном виде. Например, сможет иметь распределение N (0^ 1), %2, t или /7. Затем критическую область критерия можно выразить через его статистику В зависимости от вида #0 и #1( критическая область, выраженная через значения статистики g, принимает одну из форм: а) ц < gl, Ъ) g^ 2» gu,c) g < &, и g^g ёь. Здесь §ь gu, ga, gb — значения, выбранные по таблице распределения g так, что при выполнении Я0 справедливо соответственно одно из соотношений
Случаи а) и Ь) представляют односторонние критические области, а случай с) — двустороннюю критическую область.
Процедура применения критерия состоит в вычислении статистки 0 по выборке и в проверке, попадает ли вычисленное значение в подходящую критическую область для g. Если попадает, то мы отвергаем #0; если нет — принимаем Я0.
Пусть йв_г— вычисленное по выборке значение статистики g. Эквивалентная процедура (ее мы и используем в этой книге) со-
0
iPr(g<gt) = a, ]Рг(g^gu) = о, ..Рг = Рг = а/2.
(1.5.7)
440
Приложение I. Обзор основных понятий
стоит в вычислении вероятности того, что при выполнении #0 статистика критерия принимает значение go или даже более экстремальное, чем g0. (Экстремальные значения определяются критической областью.) Эта вероятность называется Р-значением и в нашей книге обозначается буквой Р. Если Р меньше, чем а, то гипотеза Н0 отвергается с уровнем значимости а, в противном случае Н0 принимается. Для случаев а), Ь) и с) при выполнении Я0 справедливо соответственно одно из соотношений
Я = Рг Р^Рг(ё^ёо),
Р = 2'гшп[Рг Рг(? <&,)]• <1-5.8)
В последней формуле удваивается меньшая из величин Рг (? ^ 5г &>) и Рг (§ «: ga).
Замечание 1.5.2. 1. Как и в замечании 1.5.1.1, рассмотрим случайную величину X, распределенную по закону N (ц,, ст2) с из.
с
Рис. 1.5.3. р-значения для проверки гипотезы я0: (і = [і0 при известной дисперсии о2, а — альтернатива Нх: (л > |л0; Ь — альтернатива Нх: р. < |л0; с — альтернатива Нх: (л ц0.