Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
Плотность вероятности f(X) называется функцией правдоподобия гипотезы Н, и точно так же д{Х) называется функцией правдоподобия гипотезы И'. Поэтому отношение (2) называют отношением правдоподобия.
Только что найденный критерий, наиболее чувствительный к альтернативе Н', можно сформулировать так:
Гипотезу Н следует отвергнуть тогда, когда отношение правдоподобия (2) будет не меньше v. При этом критическое значение v определяется таким образом, чтобы вероятность ошибки первого рода равнялась р, т. е. p(U s* v) = р.
Этот критерий называется критерием отношения правдоподобия. Он является наиболее мощным относительно гипотезы II', и поэтому его целесообразно применять во всех тех случаях, когда имеется большая уверенность, что гипотеза Н' может быть верна.
В. СЛУЧАЙ ДИСКРЕТНОГО РАСПРЕДЕЛЕНИЯ
Если пространство Е состоит из конечного или счетного количества дискретных точек X, причем вероятность, соответствующая любому точечному множеству, равна сумме вероятностей для отдельных точек, то можно действовать точно так же. как мы действовали в непрерывном случае. Вместо плотностей вероятности f(X) и д{Х) здесь появляются вероятности pZ и Р' X, соответствующие отдельным точкам. Эти вероятности мы снова обозначим f(X) и д{Х).
312 Гл. XI. Проверка гипотез с помощью статистических критериев
Если, в случае справедливости гипотезы Н, некоторые точки пространства Е имеют нулевые вероятности, то эти точки всегда можно присоединить к критической области V.
В остальных точках f(X) ф 0, следовательно, можно построить случайную величину
V =
ЦХ) р х •
Предположим сначала, что 1—/3 принадлежит множеству значений функции распределения G(v) случайной величины U, иными словами, найдется такое v, что
Р(д г» vf) = р.
Тогда, как и выше, в качестве V можно взять область, определяемую неравенством gs*vf с очевидней заменой интегрирования суммированием. Пусть W — любая другая область, удовлетворяющая условию Р(РР) р, и пусть D — пересечение V и W. Если
V =D + A, W = D + В, то, как и в непрерывном случае,
Р(А)*~р(В)
или
2/№=-?/(*)¦
А В
В А имеет место неравенство д vf, а в В — противоположное неравенство д < vf, поэтому
Р' V = р'D + Р'А = P'D+2 д(Х) > р'D+2 vf(X) ^
А А
» ?'D + 2 vf(X) ^ p'D + 2 д(Х) = р' D+ Р' В = p'W. в в
Таким образом, область V является решением экстремальной задачи, сформулированной выше.
Если функция 1 — G(v) не принимает значения /3, а совершает скачок от значения < /3 к значению > /3, то для построения V сначала берут всю область д> vf и, если это возможно, добавляют к ней столько точек X, удовлетворяющих условию д = vf, чтобы общая вероятность P(F) равнялась уЗ. Доказательство осуществляется точно так же, как и в непрерывном случае.
Если невозможно подобрать такие точки X, для которых P(V) = /3, то к множеству д> vf добавляют столько точек X, удовлетворяющих условию д = vf, чтобы вероятность P(F) была по возможности близка к /3 (но не превосходила /3). Пусть, например, р V = (3— е. Если к V прибавить еще одну точку X, удовлетворяющую условию д{Х) = vf(X), то вероятность ошибки
§ 59. Общие принципы. Наиболее мощные критерии
313
первого рода увеличится: P(F -f X) = р + <5, т. е. областьV + X
— слишком велика. Следовательно, точку X нужно расщепить на две точки Хг и Х2 и приписать им вероятности р11 = ? и р Хг = 8. Затем точку следует включить в область V.
Для осуществления этого расщепления применяют следующий искусственный прием, аналогичный азартной игре с вероятностью выигрыша
Если в результате эксперимента получена точка X, подлежащая расщеплению, то производится упомянутая выше «игра», причем в случае «выигрыша» гипотеза Н отвергается, а в случае «проигрыша» не отвергается. Конечно, «игра» должна производиться независимо от результата опыта.
Докажем, что такой критерий будет являться решением нашей экстремальной задачи. Точке X соответствует вероятность е + 5. Событие осуществляется тогда и только тогда, когда наступает событие X и одновременно осуществляется «выигрыш». Следовательно, вероятность события Хг равна
является вероятностью события V -f- Хи т. е. V + Хх представляет собой решение экстремальной задачи.
Указанная игра совсем не связана с выяснением вопроса о справедливости или ложности гипотезы Н. Поэтому, практически, едва ли следует пользоваться такой игрой, а нужно в качестве критической области просто выбирать множество V (без Xi). И хотя в этом случае вероятность ошибки второго рода несколько возрастет, зато, однако, уменьшится вероятность ошибки первого рода, а именно она станет равной р — е (ранее она равнялась р). Если в качестве допустимой вероятности ошибки первого рода вместо р принять р — е, то V будет решением новой экстремальной задачи, т. е. критерий, соответствующий критической области V, будет наиболее мощным с «уровнем значимости»1 /3 — е.