Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
§ 70. Коэффициент ранговой корреляции R, по Спирмену 389
Д. СЛУЧАЙ ЗАВИСИМЫХ ПРИЗНАКОВ
Мы хотим теперь исследовать, каково соотношение между истинным коэффициентом корреляции q и коэффициентом ранговой корреляции В в случае зависимых признаков?
Предположим, что в основе двух качественных признаков лежат две нормальные случайные величины х и у, плотность распределения которых задается формулой
г, \ 1 1П------------- —5-<х’- +»’> /ю\
f(x,y) = ^ V1 — е-е 2 • (18>
Для п независимых пар (xt, yt) плотность совместного распределения равна
и \ и ч l/i очТ" — 2?*<у<+у5) /1Г1Ч
/(«1, Уг)... /(*„, Уп) = (2^рГ (’ - е-)* е 2 (19)
Согласно (1),
<№ = 2 (20) где ?,• — разность между количеством тех хк, которые больше xt, и количеством тех хк, которые меньше х{.
Пусть xik и yik — случайные величины, которые при всех г и к определяются равенствами
i |-1, если xt < хк, ( + 1, если yt < ук,
xik = ч 0, если Xj =: хк. yik = < 0, если yt = ук,
(—1, если хч > хк, (—1, если yt > ук.
Тогда
'$i = 2 •Т,7? ,
к к
Если эти суммы подставим в (20), то получим
(21)
i Л /
Вычислим теперь математические ожидания от обеих частей равенства (21):
Q& (22)
i к I
Все слагаемые этой суммы, у которых г = к пли г I, равны нулю, поэтому сумма (22) содержит п (п—J) (тг — 2) равных друг другу слагаемых с к ф I и п (п — 1) одинаковых слагаемых с к = I. Таким образом,
QR= п (п — 1) (п — 2) g(a-12 у13) + п (п — 1) g(x12 у12),
ли, пиосле деления на Q — п (п— 1) (п + ])/3,
В = 3 ^ Ь(х12 Ун) 2/12)- (23)
Нам нужно теперь вычислить средние значения произведений *122/12 и ®i2 У уз- Случайная величина х12 у12 принимает значение 1,
390
Гл. XIII. Корреляция
если Ху < х2 и уу < у., или если хх > х2 и ух > х2\ в противном случае, когда х1 < х2 и у1 > у2 или когда хг> х2 w < у2, она принимает значение —1. Вероятность одновременного осуще-птвления двух событий, хг < х2 и ух < у2, равна интегралу от слотности f(xlt уJ f(x2, уо) по области, заданной неравенствами «1 < г2, 2/х < у2:
Г ГГ Г —5-(*5-1-(*! -2гх,и, + в!) ,
X е 2 е 2 dajj dyl dxz dyt.
Хх<Х8
У1<У»
Этот интеграл имеет точно такой же вид, как и интеграл, вычисленный в общем виде в § 14 В:
1 = (2 тт)-"2 . . . J е~ 2 G dx1... dx", (24)
(ux)>0 (их) >0
где п = 4,
G = 3 6^-2'ж'1 = ^ -Н 2/r + a'l — 2g*,2/2 -( (25)
<7= (1-е2)2-
Для того чтобы перейти к обозначениям из § 14 В, нужно положить
X1 = х„ х- уи X3 = X,, X4 = у2,
и1 = —1, и2 = 0. и3 — ¦{-1, «4 — 0,
«i = 0, v2 = —1, vz = 0, »4 = -f 1.
Квадратичной формой, контрагредиентной форме G, является
2 gikU Uk = + «з »з + ^26)
Отсюда получаем значения инвариантов:
(ии) = 2 9‘кЩик = + ri-^ = ,
(«») = 2 з'Ч®* = r-Г^ + '
(vv) = v = j-^г + = y^oJ ¦
Поэтому интеграл Wt = 1 равен
rrr 1 _ _ . —(uv) _____ 1 ___/ N /o-7\
§ 70. Коэффициент ранговой корреляции R, по Спирмену 391
Точно такое же значение имеет и вероятность W2 одновременного осуществления событий хх > х2 и ух > у2. Вероятность W3 одновременного осуществления событий хх> хг и ух < уг получается умножением vt на (— 1):
W3 = j,1- arc cos (28)
Такое же значение имеет и вероятность РГ4 одновременного осуществления событий хх < х2 и ух > у2. Поэтому среднее значение хХ2у12 равно
S *12^12 = (Wi -t ^2) • 1 -г (W, -Г WJ (— 1) = 2WX — 2W3 =
= -- arc cos (— о) — — arc cos q =
71 W 71
= ” r arc s*n — я (2— arc s*n = л arc sin
Аналогично вычисляется среднее значение случайной величины х12у13. Она принимает значение 1, если хх < х2 и ух < ys
или если хх > х2 и ух > у3. Вероятность одновременного осуще-
ствления первых двух событий равна
W5 = (2^}з (1 — О2)2 JJJJJJ е ~G dx,dyx dx2 dy2 dx3 dy3,