booksshare.net -> Добавить материал -> Физика -> Варден Б.Л. -> "Математическая статистика" -> 147

Математическая статистика - Варден Б.Л.

Варден Б.Л. Математическая статистика — М.: Ил, 1960. — 435 c.
Скачать (прямая ссылка): matematstatistika1960.pdf

Предыдущая << 1 .. 141 142 143 144 145 146 < 147 > 148 149 150 151 152 153 .. 178 >> Следующая

где область интегрирования определяется неравенствами

Интеграл 1 не зависит от ut, поэтому в формуле (10) множитель 1 можно вынести за знак интеграла. Тогда получим

Согласно (12),

следовательно,

(14)

Если положим

+ • ¦ ¦ “Ь — Q2>

(15)

(16)

Ywl+i*

(17)

(13) в виде

(18)

4^0,

и? + ?2 = (п — 1) sj < (п — 1)6,

(19)

= г < с.
366

Гл. XIII. Корреляция

где область интегрирования задается неравенством

п

uf = (п — 1) — j) а

(21)

2

Если в этом интеграле также ввести полярные координаты %, ср\, . . (р'п-г, то снова можно будет проинтегрировать по угловым

переменным. В результате получим

Само собой разумеется, что этот результат справедлив не только для области специального вида (9), но также и для произвольной области G в пространстве переменных s2, г. Пусть G' — преобразованная область, расположенная в пространстве новых переменных %, Q, гс, которые определяются равенствами

Знаменатели сг2, сг2 и сгу добавлены для того, чтобы формулы были справедливы и тогда, когда сгх и о\не равны единице. В этом случае области G соответствует вероятность

где интегрирование распространяется на преобразованную область G’. Постоянную а, конечно, следует определить таким образом, чтобы интеграл по всему пространству О

равнялся единице.

где область интегрирования задается неравенствами

X2 < (п — 1) а, го2 + ?2 < (п — 1) Ъ,

(23)

(24)

(25)

(26)

е 2 *’ уп-2 (1Х . е

1

?п~3 dQ ' е 2 Ш dw, (27)

1

9
§ 67. Коэффициент корреляции как признак зависимости 367

Результат можно сформулировать так:

у2 = и, Q2 = v и w являются независимыми случайными величинами с плотностями вероятности

/(«) = ctj е 2 " и 2 , ctj = — 1 п-1 ; (28)

' 2~

g(v) = а2 е 2 " v 2 , а2 = -------------------\^ ; (29)

1п—2\ — "

Г — -I 2 2

А(«0 = (30)

\ 2тс

Поэтому у2 и Q1 подчиняются распределению %2 с п — 1 и п — 2 степенями свободы соответственно. Случайная величина w распределена нормально с нулевым средним значением и единичной дисперсией.

Теперь легко можно вывести распределение выборочного коэффициента корреляции г. Сначала равенство (26) разрешим относительно ?:

и затем построим отношение

, = ^1^2 = ^^“2- (3D

Так как w имеет нормальное распределение и Q подчиняемся распределению %2 с п— 2 степенями свободы, то, согласно § 28, случайная величина t подчиняется распределению Стьюдента сп — 2 степенями свободы. Зная границы для t, соответствующие обычным уровням значимости (5, 2 и 1%), и пользуясь формулой (31), немедленно получаем границы для выборочного коэффициента корреляции г. Эти границы табулированы в табл. 13, в конце книги.

Таблица 13 применяется следующим образом: если в результате практических вычислений получается такое значение г, абсолютная величина которого превосходит границу г„ из табл. 13, то случайные величины х и у считают зависимыми.

Относительно уровня значимости этого критерия можно сказать следующее.
368

Гл. XIII. Корреляция

Если х и у зависимы и если, согласно этому критерию, независимость отвергается, то в данном случае никакой ошибки не возникает1.

Может быть и другой случай, когда х и у независимы и распределены приближенно нормально. В этом случае истинный уровень значимости критерия приближенно равен 2/3, так как именно с таким уровнем строился точный критерий для проверки независимости двух нормальных случайных величин.

Имеется и третий случай, когда х и у независимы, но их распределения существенно отличаются от нормального. В этом случае истинный уровень значимости критерия может оказаться несколько больше, чем 2/3. Однако если х и у обладают конечными дисперсиями и п достаточно велико, то отклонение истинного уровня значимости от 2/3 не будет значительным. Это происходит потому, что случайные колебания г определяются главным образом случайными колебаниями числителя

2 (X —1с) (у — у). (32)

Если п велико, то х и у можно приближенно заменить истинными средними значениями х и у. Тогда вместо (32) получим

2 (х — *) (у — У)-

Это выражение представляет собой сумму большого количества независимых слагаемых, квадратичное отклонение каждого из которых равно о-хо-у. Следовательно, согласно центральной предельной теореме (§ 24 Г), эта сумма распределена приближенно нормально с нулевым средним значением и дисперсией nojpr*. Знаменателем г является (п— l)sxsy, следовательно, этот знаменатель приближенно равен тгх<ту. Поэтому при п —> оо случайная величина т распределена асимптотически нормально с нулевым средним значением и дисперсией 1 /п, безотносительно к тому, распределены х и у нормально или пет. Таким образом, при п —> оо истинный уровень значимости стремится к 2/3. Для конечных, не слишком малых п отклонение от 2/3 не очень значительно.

Предыдущая << 1 .. 141 142 143 144 145 146 < 147 > 148 149 150 151 152 153 .. 178 >> Следующая