Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
При практическом применении этих результатов возникают различные трудности. Так как значение q заранее не известно, то нельзя вычислить сг. Часто в правей части (11) g заменяют на г и, таким образом, получают следующую оценку для сг:
Однако эта оценка является надежной лишь тогда, когда п очень велико и д2 не близко к единице. Если значение п является лишь умеренно большим и если д>2 близко к единице (признаком этого является близость к единице значения г2), то «может значительно отличаться от сг. Креме того, математическое ожидание г отклоняется от q, т. е. оценка г имеет смещение. В этом можно
т
В результате получаем асимптотическую формулу
1 1
Jk—jePk —^Sik г — п ^ 'V---------------
(16)
§ 69. Распределение выборочного коэффициента корреляции 379
очень легко убедиться, вычислив несколько следующих членов приближения (16). В результате найдем, что
6' = е-4тгЕт + ---¦ (18>
Ко всему тому нужно еще добавить, что для умеренных значений п точное распределение г может значительно отклоняться от нормального распределения, особенно тогда, когда значение е2 близко к единице. Таким образом, при вычислении доверительных границ для е по заданному г нельзя непосредственно применять нормальное распределение, а нужно воспользоваться точной функцией распределения г или по меньшей мере улучшенным приближением для этой функции.
В. ТОЧНОЕ РАСПРЕДЕЛЕНИЕ «у И Г
Плотность совместного распределения трех случайных величин s2, sj и г можно вычислить следующим образом. Введем сначала для оценок дисперсий и ковариации обозначения:
sxx = s%, syy = tf, sxy = rsxsy. (19)
Пусть снова у = Кх + z = qx + z, где z — случайная величина, не зависящая от х. Построим сценки дисперсий и ковариации, аналогичные (19):
sxx = 4, sxz = rsxsz, szz = s*, (20)
где г' — выборочный коэффициент корреляции между х и z.
Величины (19) можно легко выразить через величины (20):
®ху = Q^xx "Ь ®хг > (21)
Syy = Q2Sxx "t 2qsxz -j- szz.
Вместо трех величин (20) можно ввести независимые случайные величины х• w’ С> указанные в § 67. Согласно (22) § 67, плотность совместного распределения %, w и ? задается формулой
ji —jLu,1 тг — 2 п — 3
fo(X> w> О = а е X с , (22)
где а — постоянный нормирующий множитель.
Случайные величины (20) выражаются через %, го, ? следующим образом:
(я — 1) «XX = O'! t’
(И—1) Sxz = crxcrzX, } (2?,)
(та — 1) s22 = Ы2 + С2)-
380
Гл. XIII. Корреляция
При этом, согласно (5), сг\= \/д = 1/(1 — д2) и о-* = 1.
С помощью плотности (22) и формул (23) можно сначала найти плотность распределения случайных величин sxx, sxz и szi, затем с помощью формул (21) вычислить плотность для sxx, sxy и иуу и, наконец, воспользовавшись формулами (19), найти плотность совместного распределения sx, syur. В результате окажется, что плотность совместного распределения трех случайных величин
sx, sy и г имеет вид
f{sx, sy, г) = (24)
= яГ(п___2) С - + ^ ,Г2 s„-2 (1 _ ra)V_
Этот результат принадлежит Фишеру [Fisher R. A., Biometrika, 10 (1915), 507].
Г. ВСПОМОГАТЕЛЬНОЕ ПРЕОБРАЗОВАНИЕ ФИШЕРА
Интегрированием (24) по sx и sy получаем плотность вероятности для г:
=*?=*) <1 - ^ <1 -^ • (25)
О вычислении этой плотности см. Kendall М. G., Advanced Theory of Statistics, I, 14.14, или только что цитированную работу Фишера, опубликованную в журнале Biometrika, 10.
Фишер указал очень практичное преобразование случайной величины г, с помощью которого распределение с плотностью (25) приближенно преобразуется в нормальное распределение. Это преобразование задается формулой
* = г I” Ш • (26)
Распределение случайной величины г очень хорошо аппроксимируется нормальным распределением с не зависящей от q дисперсией
1
г га— 3
н средним значением
(27)
?г= * 1п|±в+ _ (28)
^ 2 1 — о ' 2(п—])
Поправочный член в правой части (28) Есегда мал сравнительно с квадра I нчным отклонением a-t и поэтому таким ела-
§ 69. Распределение выборочного коэффициента корреляции 381
гаемым можно пренебречь. Оно оказывается существенным лишь тогда, когда вычисляется много выборочных коэффициентов корреляции и из соответствующих значений z образуется среднее.
Насколько сильно улучшает нормальное приближение переход от г к z, можно видеть на рис. 37 и 38, заимствованных из книги: Fisher R. Л., Mathematical Methods for Research Workers (11th ed., Fig. 8, p. 200).