Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
В случае зависимых случайных величин теорема об асимптотической нормальности практически не очень полезна, так как при умеренно больших значениях п распределение Т может обладать значительной асимметрией и, кроме того, дисперсия Т неизвестна. Однако, в случае независимых хну, дисперсия Т известна [она задается формулой (8)], и уже при п = 8 нормальное приближение оказывается очень хорошим. Следовательно, Т можно с успехом использовать в качестве статистики критерия для проверки независимости признаков. Точное распределение Т известно для п =г 10 (Kendall М. G., Appendix Table 1); при и> 10 можно воспользоваться нормальным приближением, т. е. гипотезу независимости следует отвергнуть тогда, когда Т (или, в случае двустороннего критерия, | Т |) превосходит границу
Tp = <rTW{\-f}). (10)
Уровень значимости такого одностороннего критерия приближенно равен р, а уровень двустороннего критерия приближенно равен 2/3.
§ 71. Коэффициент ранговой корреляции Т, по Кендаллу 397
В. СРАВНЕНИЕ II И Т
Если мы предположим, что х и у распределены нормально, и разложим математические ожидания В и Т в степенные ряды по q, то получим
Отсюда следует, что при больших п и малых q математические ожидания относятся приблизительно как 3:2. С другой стороны, если при g = 0 сравнить квадратичные отклонения, а именно
то при больших п снова найдем то же отношение 3:2. Отсюда можно, предположительно, сделать вывод, что случайные величины ВиТ относятся друг к другу приблизительно как 3:2, если только их абсолютные величины не слишком близки к единице. Этот вывод был подтвержден результатами Дэниелса, согласно которым коэффициент корреляции случайных величин В и Т при п -» оо стремится к единице, причем он близок к единице уже при не слишком бсльших значениях п (см. Kendall М. G., Rank correlation methods 5.14).
Какая статистика является наилучшей для построения критерия независимости признаков, В или Т? Односторонний критерий В отвергает гипотезу независимости, если В > Bfi; в случае критерия Т тот же вывсд делается при Т> ТНам нужно исследовать, какой из этих двух критериев имеет наибольшую мощность (в смысле § 59). Под мощностью критерия в данном случае мы понимаем вероятность отвергнуть гипотезу независимости, когда случайные величины х и у действительно являются зависимыми.
Для ответа на этот вопрос мы должны будем сначала сделать некоторое предположение о распределении х и у. А именно, мы предположим, что совместное распределение х и у является нормальным. Тогда, в силу § 69, плотность этого распределения можно задать формулой
(П)
(12)
1
(13)
(14)
398
Гл. XIII. Корреляция
В этом случае мощности критериев Е и Т будут являться функциями ОТ Q.
Предположим сперва, что п настолько велико, что обе случайные величины Ли Т распределены почти нормально. Тогда границы Rp и Т.. можно будет определить с помощью нормального распределения:
Разумеется, значения crR н сгт в формулах (16) и (17) вычислены при 9 = 0. Если g отлично от нуля, то значения crR и сгт изменятся, однако это изменение является лишь величиной порядка д2 и поэтому им сначала можно пренебречь. Таким образом, в первем приближении вычисление функций мощности для критериев В и Т мы будем производить с помощью нормальных распределений, математические ожидания которых задаются формулами (11) и (12), а квадратичные отклонения — формулами (13) и (14). Тогда мощность критерия R, или вероятность события R > Rj, будет равна
случае выражения (18) и (19) окажутся практически равными единице. Поэтому можно предположить, что д2 является величиной порядка 1/п. Если теперь в формулах (18) и (19) пренебречь всеми членами порядка малости 1 /те или выше, то для Mr{q) и Mt{q) получим одну и ту же функцию M(q), а именно
Следовательно, в первом приближении оба критерия имеют одну и ту же функцию мощности. График этой функции изображен сплошной линией на рис. 39 и обозначен M(q).
Это приближение мы теперь постараемся последовательно уточнить. Если сначала воспользоваться нормальными приближе-
B„=o-RV(l ,
\ п— X
(16)
5
1-------
(17)
(18)
и точно так же мощность критерия Т будет равна
Если g велико сравнительно с 1 /Уп ¦— 1, то R будет значительно больше сrR, а Т — значительно больше егг. Таким образом, в этом