Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
где область интегрирования определяется неравенствами
Интеграл 1 не зависит от ut, поэтому в формуле (10) множитель 1 можно вынести за знак интеграла. Тогда получим
Согласно (12),
следовательно,
(14)
Если положим
+ • ¦ ¦ “Ь — Q2>
(15)
(16)
Ywl+i*
(17)
(13) в виде
(18)
4^0,
и? + ?2 = (п — 1) sj < (п — 1)6,
(19)
= г < с.
366
Гл. XIII. Корреляция
где область интегрирования задается неравенством
п
uf = (п — 1) — j) а
(21)
2
Если в этом интеграле также ввести полярные координаты %, ср\, . . (р'п-г, то снова можно будет проинтегрировать по угловым
переменным. В результате получим
Само собой разумеется, что этот результат справедлив не только для области специального вида (9), но также и для произвольной области G в пространстве переменных s2, г. Пусть G' — преобразованная область, расположенная в пространстве новых переменных %, Q, гс, которые определяются равенствами
Знаменатели сг2, сг2 и сгу добавлены для того, чтобы формулы были справедливы и тогда, когда сгх и о\не равны единице. В этом случае области G соответствует вероятность
где интегрирование распространяется на преобразованную область G’. Постоянную а, конечно, следует определить таким образом, чтобы интеграл по всему пространству О
равнялся единице.
где область интегрирования задается неравенствами
X2 < (п — 1) а, го2 + ?2 < (п — 1) Ъ,
(23)
(24)
(25)
(26)
е 2 *’ уп-2 (1Х . е
1
?п~3 dQ ' е 2 Ш dw, (27)
1
9
§ 67. Коэффициент корреляции как признак зависимости 367
Результат можно сформулировать так:
у2 = и, Q2 = v и w являются независимыми случайными величинами с плотностями вероятности
/(«) = ctj е 2 " и 2 , ctj = — 1 п-1 ; (28)
' 2~
g(v) = а2 е 2 " v 2 , а2 = -------------------\^ ; (29)
1п—2\ — "
Г — -I 2 2
А(«0 = (30)
\ 2тс
Поэтому у2 и Q1 подчиняются распределению %2 с п — 1 и п — 2 степенями свободы соответственно. Случайная величина w распределена нормально с нулевым средним значением и единичной дисперсией.
Теперь легко можно вывести распределение выборочного коэффициента корреляции г. Сначала равенство (26) разрешим относительно ?:
и затем построим отношение
, = ^1^2 = ^^“2- (3D
Так как w имеет нормальное распределение и Q подчиняемся распределению %2 с п— 2 степенями свободы, то, согласно § 28, случайная величина t подчиняется распределению Стьюдента сп — 2 степенями свободы. Зная границы для t, соответствующие обычным уровням значимости (5, 2 и 1%), и пользуясь формулой (31), немедленно получаем границы для выборочного коэффициента корреляции г. Эти границы табулированы в табл. 13, в конце книги.
Таблица 13 применяется следующим образом: если в результате практических вычислений получается такое значение г, абсолютная величина которого превосходит границу г„ из табл. 13, то случайные величины х и у считают зависимыми.
Относительно уровня значимости этого критерия можно сказать следующее.
368
Гл. XIII. Корреляция
Если х и у зависимы и если, согласно этому критерию, независимость отвергается, то в данном случае никакой ошибки не возникает1.
Может быть и другой случай, когда х и у независимы и распределены приближенно нормально. В этом случае истинный уровень значимости критерия приближенно равен 2/3, так как именно с таким уровнем строился точный критерий для проверки независимости двух нормальных случайных величин.
Имеется и третий случай, когда х и у независимы, но их распределения существенно отличаются от нормального. В этом случае истинный уровень значимости критерия может оказаться несколько больше, чем 2/3. Однако если х и у обладают конечными дисперсиями и п достаточно велико, то отклонение истинного уровня значимости от 2/3 не будет значительным. Это происходит потому, что случайные колебания г определяются главным образом случайными колебаниями числителя
2 (X —1с) (у — у). (32)
Если п велико, то х и у можно приближенно заменить истинными средними значениями х и у. Тогда вместо (32) получим
2 (х — *) (у — У)-
Это выражение представляет собой сумму большого количества независимых слагаемых, квадратичное отклонение каждого из которых равно о-хо-у. Следовательно, согласно центральной предельной теореме (§ 24 Г), эта сумма распределена приближенно нормально с нулевым средним значением и дисперсией nojpr*. Знаменателем г является (п— l)sxsy, следовательно, этот знаменатель приближенно равен тгх<ту. Поэтому при п —> оо случайная величина т распределена асимптотически нормально с нулевым средним значением и дисперсией 1 /п, безотносительно к тому, распределены х и у нормально или пет. Таким образом, при п —> оо истинный уровень значимости стремится к 2/3. Для конечных, не слишком малых п отклонение от 2/3 не очень значительно.