Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
X2 — (т—1 степеней свободы), (3)
npi
и если х2 превосходит границу, найденную по табл. 6, то гипотезу отвергают.
Строго говоря, распределение х2 имеет место лишь асимптотически при п—>оо. Точное распределение случайной величины X2 является дискретным, так как при заданных п и pt величина X2 может принимать лишь конечное число значений.
Для того чтобы проверить, насколько близки точное распределение и распределение х2> я Для случая
п — 10; рх = 0,5; рг = 0,3; рг = 0,2 вычислил точное распределение случайной величины
18 Б. Л. ван дер Варден - 1062
274 Гл. XI. Проверка гипотез с помощью статистических критериев
и сравнил его с асимптотическим распределением. В этом случае
(*х —5)» , (*2— 3)* , (х3~ 2)* 5 3 2
(5)
Имеется 66 возможных троек чисел (х1г х2, х3), удовлетворяющих условию ®i + ж2 + *з = Ю. Тройке (х1г хг, х3) соответствует вероятность
<ч
Каждая тройка, согласно (4) и (5), приводит к определенному значению Y. Эти значения и их вероятности (6) определяют некоторую ступенчатую функцию, являющуюся функцией распределения случайной величины Y (рис. 28).
Асимптотическая функция распределения х2 с двумя степенями свободы равна
G(u) = j
е~1 dt = 1 — е~и.
Р и с. 28. Точное и асимптотическое распределение У с двумя степенями свободы (га = 10, Pi = 0,5, рг = 0,3, Рз = 0,2).
Поэтому асимптотическая функция распределения случайной величины Y задается формулой
I 0, v < 0,
F(v) = < v, 0*s v < 1, (7) \ 1, v ^ 1
и имеет своим графиком прямую, изображенную на рис. 28. Отклонение точной функции распределения Y от асимптотичсской мало, особенно в интервале от 0,95 до 1, который наиболее важен для приложений. Вероятность события х2> 9,21 при асимптотическом распределении должна быть равна 0,01, а в действительности она равна 0,0096. Вероятность события %2 > 5,99, которая должна быть равной 0,05, в действительности равна 0,0502. В большинстве случаев истинный уровень значимости критерия х2 оказывается даже меньше уровня значимости, вычисленного по асимптотической формуле, поэтому примене-
§ 56. Применения критерия хг
275
ние асимптотического распределения, как правило, лишь увеличивает надежность критерия1.
В литературе часто можно найти замечание, что асимптотическое распределение можно применять лишь тогда, когда наблюденные х{ или их математические ожидания пр{ не слишком малы. Только что приведенный пример показывает, что математические ожидания npi могут быть равны лишь двум или трем единицам и тем не менее асимптотическое распределение отзывается еще применимым. Это же подтверждается и другими примерами. Если имеется много классов, то математические ожидания могут быть даже равны единице. Я однажды проводил вычисления в примере с десятью классами
пр1 = 1, пр2 = 1, ... , пр10 — 1 [п= 10)
и нашел все еще удовлетворительное согласие с асимптотическим распределением %2. Следовательно, чрезмерная осторожность является излишней.
В. СРАВНЕНИЕ ДВУХ ВЕРОЯТНОСТЕЙ
Пусть некоторое событие в щ опытах наступило хх раз и не наступило ух раз. И пусть в новых п2 опытах это событие наступило х2 раз и не наступило у2 раз. Нужно проверить, изменилась ли вероятность события или нет? Все опыты предполагаются независимыми.
Гипотеза, которую мы хотим проверить, гласит: вероятность р в обоих случаях одинакова. Значения р мы не знаем. Для того чтобы вычислить х2, мы должны р заменить некоторой оценкой, а именно, асимптотически эффективной оценкой, так как иначе значение %2 может получиться слишксм большим (§ 51).
Для отыскания такой оценки мы воспользуемся методом наибольшего правдоподобия. Если вероятность осуществления события в каждом отдельном опыте равна р, то вероятность того, что в щ опытах это событие наступит хг раз, а в п2 опытах наступит х2 раз, равна
..П1'---пд! ,+1, лВ|+В.
Zj! ух'. Zj! у21 г *
При вычислении максимума этого выражения на числовой множитель можно не обращать внимания. Максимум достигается в точке
' - Ш. ¦ (8>
1 Надежность критерия ха увеличивается, так как реже будет ошибочно отвергаться испытываемая гипотеза, когда она имеет место в действительности и вместе с тем мы с большим основанием будем заключать о существенности (неслучайности) расхождений между наблюдаемым в опыте
распределением и гипотетически допускаемым. — Прим. ред.
1Ь*
276 Гл. XI. Проверка гипотез с помощью статистических критериев
С помощью этого значения р н q = 1 — р образуем теперь
^2 _ fa —щр)* _J_ (У1 — ЩЧУ fa — _j_ {Уг — Щ1Г (д)
nip Mi 5 п2р nt2
или, что то же самое,