Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
Для того чтобы знать, при каких г можно уверенно делать указанный вывод, мы должны уметь отвечать на следующий вопрос: насколько может отклоняться от нуля выборочный коэффициент корреляции г, если, в действительности, случайные величины х и у независимы и поэтому q — 0?
1 Практически использование коэффициента корреляции в качестве меры зависимости оправдано лишь тогда, когда предполагается, что случайные величины х и у распределены нормально. В общем случае коэффициент е как мера зависимости может оказаться неудовлетворительным. Например, если х принимает значения 1/n, 1 и п с вероятностями 2n/(n — I)8,
1 — 4 п/(п — I)2 и 2 пЦп — I)2 соответственно и если у = 1/ж, то Qxy —4n/(n — I)2. Таким образом, при п —> оо коэффициент корреляции
стремится к нулю, хотя хну связаны функциональной зависимостью. О других мерах зависимости, лишенных недостатков коэффициента корреляции, см. Д у н н н - Б а р к о в с к и й И. В. и Смирнов Н. В., Теория вероятностей п математическая статистика в технике (общая часть), ГИТТЛ, М., 1955, гл. VII. — Прим. перев.
§ 67. Коэффициент корреляции как признак зависимости 363
Предположим, что х и у независимы и распределены нормально. Заменой а; на а (х—х) и у на Ъ (у — у) можно добиться, чтобы обе величины имели нулевое среднее значение и единичную дисперсию. Следовательно, мы можем считать, что совместная плотность распределения случайных величин х и у задается формулой
fix, У) =f(x)f(y) = <г+Н> (1)
Так как отдельные пары (xlt у-^), . . ., (хп, г/п) предполагаются независимыми друг от друга, то совместная плотность вероятнее™ всей системы (х1, ух, . . ., хп, уп) равна произведению
/(*к Vi) ¦ ¦ ¦ /(*„, Уп) = (2^г (2)
Спрашивается, какова функция распределения г?
Мы исследуем сейчас несколько более общий вопрос, а именно каково совместное распределение пяти случайных величин: х, у, ssf, и г, т. е. какова вероятность того, что все эти величины будут лежать в заданных границах?
Прежде всего с помощью ортогонального преобразования можно легко выделить распределение х и у. Для этого случайные величины xlt ..., хп ортогонально преобразуем в щ, . . ., ип таким образом, чтобы щ была пропорциональна выборочному среднему х:
ul=^ + ^ + ...+^=-xW.)
\ п \ п \ п Г
щ Ч- а22х2 + ... + а.2пхп, ( (3)
Ki/i,..., уп применим ортогональное преобразование с теми же самыми коэффициентами:
\п \п \п
г>2 = а21у1 4- а,2у, -[-¦¦¦+ а.,пуп, ( (4)
Тогда 11 2 yf = 2 vt- ^ так как суммы х; + г/,-
подвергаются этс му же преобразованию, например
Ul + V2 = а21 (х1 -j- Уг) + d22 (Х2 4" У2) ~1' • • • + а2П (Хп “Ь Уп)’ то отсюда следует, что
2 (xi + 2//)2 = 2 (ui + vi)2-
364
Г л. XIII. Корреляция
Если из обеих частей последнего равенства вычесть 2х* = = 2й2’ 2у2 = и результат разделить на 2, то получим
{п — 1) в2 = У х2 — пх2 = У м2 — и\ = + . . . + и2, (7)
[п — 1) в2 = У у- — пу2 = 2 V2 — v2 = v\ + . . . + v2. (8)
Так как случайные величины щ и vx не зависят друг от друга и от остальных и2, v2, . . ., ип, vn, то х и у не зависят друг от друга и от в2, Sy и т.
Разумеется, х и у распределены нормально с дисперсией 1 /п. Поэтому нам осталось исследовать лишь распределение случайных величин s2, и г, являющихся функциями от и2, vit . . ., ип, vn. Эти функции задаются формулами (6), (7) и (8). Постараемся вычислить вероятность события
где область интегрирования G определяется неравенствами (9).
В формуле (10) можно сначала интегрировать по г>2, . . vn, а затем — по и2, . . ., ип. При внутреннем интегрировании по v2, . . ., vn величины и следует рассматривать как постоянные. Введем ортогональное преобразование переменных v, считая и фиксированными:
где коэффициенты первой строки определяются формулами
(5)
Таким образом,
(2х2—п х2) (2 у2—п уг)
(игу2 + . . . + ипУп)2 (иа + . . . + «л) (t>2 + ¦ ¦ ¦ + Уп)
(6)
И
s\ <а, в2 < Ь, Т < с. Эта вероятность равна интегралу
О)
du2 dv2. . . dun dvn, (10)
(И)
(12)
§ 67. Коэффициент корреляции как признак зависимости 366
Сумма квадратов коэффициентов Ъ21 равна единице, следовательно, в силу § 13, коэффициенты остальных строк можно определить таким образом, чтобы все преобразование было ортогональным. Тогда внутренний интеграл запишется так:
то, в силу (8) и (14), т и s? окажутся зависящими лишь от wt и?2:
Для того чтобы вычислить интеграл (13), мы вместо wa,. . ., wn введем полярные координаты ?, (plt . . ., <рп_3. Так как неравенства
(9), определяющие область интегрирования, не зависят от угловых переменных, то можно сразу же проинтегрировать по (plt . . ., <р„_з и, положив w2 = w, записать внутренний интеграл