Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
^2 _ (jgx—%Р)г fa~ п2р)2 J- j
«lP? n'pq
Но
(жг — + (х2 — га2р) = о,
следовательно, можно записать короче:
^2 . (х1—п1р)г К + «г) ^ ^
n^hpq
Ранее мы видели, что при малых щ и п2 множитель N = щ + + пг в числителе (II) целесообразно заменить на N—I. При этом истинкый уровень значимости будет лишь незначительно превышать заранее заданную величину (см. § 9). Таким образом, для сравнения двух вероятностей вместо у? следует пользоваться статистикой
2 _ fa — Щр)2 (Wt + Щ — l) __ (ххЩ — х3пх)г(щ + пг—1) -Jgx
1 n1n2pj + хг) (г/х + у2)
Число степеней свободы равно
/==4-2 —1=1,
так как наблюдались четыре количества ж,, ух, х2, у2, связанные двумя линейными уравнениями, и оценивался один неизвестный параметр р по формуле (8).
Г. ПРОВЕРКА1НЕЗАВИСИМОСТИ ДВУХ ПРИЗНАКОВ
Пусть N объектов расклассифицированы по двум парам признаков, вследствие чего возникают четыре класса (так называемая таблица сопряженности признаков 2x2), и пусть жи, х12, *2i. ®22 “ количества объектов в этих четырех классах. Нужно проверить, будут ли обе пары признаков независимыми? Пусть р! и рг — вероятности тоге, ч^о в отдельном опыте объект будет обладать соответственно первым или вторым признаками, принадлежащими первой паре, я пусть qt и q2 — вероятности признаков второй пары (pi-r p2=l, -1 ?2 ~ О- Нели признаки
независимы, то четырем классам соответствуют вероятности р$г, ТДг, P&v Mi'
§ 56. Применения критерия х2
277
Значения pt и qk неизвестны. Если для их оценки снова воспользоваться методом наибольшего праЕдеподооия, то найдем
я, = хп + х„, то получим то же самое выражение, что и (9), которое можно преобразовать в (13) или (11), или
Так как наблюдались четыре количества, связанные одним линейным соотношением
и два неизвестных параметра рх и qx оценивались по результатам наблюдений с помощью формул (13), то число степеней свободы
равно
Если множитель N в числителе (15) мал, то его снова целесообразно заменить величиной N — - 1.
Среди английских статистиков в свое время велась большая дискуссия по вспрссу о выборе числа степеней свободы. Если проверка независимости признаков производится на основе таблицы 2 х 2, то чему должно равняться это число, 1 или 3? Первоначально Карл Пирсон вывел критерий х2 только для случая, ко1 да вероятности pt и qk заданы. При этом предположении асимптотически для больших N имеет место распределение f с 4 —
— 1=3 степенями свободы. Если истинные р( и дк заменить их приближенными значениями (13), то %г может лишь уменьшиться. Поэтому истинное значение %2 не меньше приближенного значения (15). Следовательно, если приближенное значение (15) превосходит границу и, то и истинное значение %2 заведомо превосходит и. Пусть граница и выбрана по таблице с тремя степенями свободы, тогда вероятность того, что истинное значение
X2 будет удовлетворять неравенству х2> и> равна /3 ( = 0,01 или 0,05). Таким образом, для того чтобы иметь уверенность, что уровень значимости критерия х2 не превосходит j3, нужно
(13)
С помощью Pi и qk можно образовать
..2 (*и — a’Pi9i)2
* - — шг~
xpiit
(s„ —Afoaia)2 Np2q2
fa, — A>i?a)8 i
(*21 — ffiPagi)2
A'Mi
(14)
Если в числителях и знаменателях Npt заменить величинами
У.
,2
______________(хХ1хг2 — х1гХу)2 N _________________
(*11 + *12) (*21 + *22) (*11 + *2l) (*12 + *22) ‘
(15)
хп ; х12 ч- хи + х22 = N,
/ = 4— 1 —2 = 1.
278 Гл. XI. Проверка гипотез с помощью статистических критериев
пользоваться таблицами распределения %г с тремя степенями свободы — такой вывод делал Пирсон,
В противоположность этому, Фишер оправдывал свою точку зрения так: величина у*, вычисленная по формуле (15) (назовем ее х2)’ в большинстве случаев оказывается меньше истинного значения х2- Следовательно, вероятность события х2> и СУ* щественно меньше вероятности события х2 > и• Таким образом, уровень значимости критерия у} с тремя степенями свободы существенно меньше /3, т. е. он излишне мал. Но если принять / = 1, то уровень значимости будет в точности равен /3.
Так как Фишер не смог точно доказать справедливость своего взгляда и приводил лишь наводящие соображения, то Юль и Браунли с помощью обширных случайных экспериментов попытались установить, каково число степеней свободы у функции распределения х2 : / = 3 или / = 1? Опыты показали, что прав был Фишер, однако противники взгляда Фишера стали критиковать это экспериментальное доказательство. В конце концов спор был полностью решен Нейманом и Е. Пирсоном1, которые с помощью математического доказательства установили, что интуиция Фишера была правильной.