Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
Критерий Вилкоксона нулевую гипотезу немедленно отвергает. Так как все х больше любого из у, то количество инверсий равно 16. Для того чтобы применить табл. 10, нужно х и у поменять местами; в этом случае количество инверсий станет равным нулю. В столбце (4; 4) при и = 0 находим, что вероятность события V = 0 равна 0,0143. Так как эта вероятность меньше чем 0,025, то, согласно одностороннему критерию с /3 = 0,025 или согласно двустороннему критерию с 2/3 = 0,05, нулевую гипотезу следует отвергнуть.
Для применения критерия X нужно все х и у расположить в порядке возрастания их величины (при этом гг,- будут иметь порядковые номера 5, 8, 6 и 7) и вычислить
= 0,14 + 1,22 + 0,43 + 0,76 = 2,55.
Для вычисления X можно воспользоваться табл. 2, в конце этой книги, или более удобной табл. 2 ван дер Вардена—Нивергельта. При п = 8 и д — h= 0 двусторонняя 5%-ная граница равна 2,40 (табл. 11). Следовательно, по критерию X нулевую гипотезу нужно также отвергнуть.
ГЛАВА XIII
КОРРЕЛЯЦИЯ
В этой главе будет предполагаться известным лишь содержание первых шести глав.
§ 66. Ковариация и коэффициент корреляции
А. ИСТИННЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ
Если х и у — две зависимые случайные величины, то дисперсия
суммы Хх + у, помимо дисперсий слагаемых Я х и у, содержит
еще член, линейный относительно А:
6(* ж + у — А х — у)2 = A2 Q(x — х)2 +
+2Я?(аг— х) (у — у) + &{у — у)-. (!)
Коэффициент при 2А в правой части (1) называется ковариацией случайных величин х и у. Если ковариацию разделить на произведение квадратичных отклонений (гхсгу, которые предполагаются отличными от нуля, то получится истинный коэффициент корреляции q:
= €(»-?) (у-У) .
<гх сг у '
С помощью (2) формулу (1) можно записать так:
(Глх+у = ? -(Jx + 2Л о<тусгу 4 0-2. (3)
Коэффициент корреляции тесно связан с коэффициентом регрессии у, который определяется следующим образом. Положим
у = ух + z (4)
и определим у так, чтобы дисперсия z была наименьшей. Дисперсию разности z = y — ух можно вычислить по формуле (3), заменив А на —у:
о-f = у2а2 — 2у Q(rxo-y + сг2. (5)
Правая часть (5) представляет собой многочлен относительно у, достигающий минимума в точке
у = е?- (6)
и х
Формула (6) связывает коэффициент регрессии у с коэффициентом корреляции q.
§ 66. Ковариация и коэффициент корреляции 369
Значение минимума многочлена (5) равно
о-2 = — 2 eV2 + о-® = (1 — е2)°1 ¦ (7)
Из (7) непосредственно следует, что
1 — е2 г» 0.
Таким образом, значение коэффициента корреляции заключено в пределах —1 и +1.
Если д принимает одно из крайних значений, равных +1, то, согласно (7), сгг = 0. В силу последней теоремы из § 3, это возможно лишь тогда, когда z с вероятностью единица является постоянной величиной, т. е. когда у с вероятностью единица представляет собой линейную функцию от ж:
у = ух + а. (8)
Коэффициент корреляции д является мерой зависимости (мерой линейной зависимости) между х и у. В случае независимости этих величин д = 0. Если же ж и у связаны точной линейной зависимостью (8), то q = +1; при этом знак д, в силу (6), всегда равен знаку коэффициента регрессии у.
Смысл коэффициента корреляции можно выяснить с помощью анализа дисперсии величины у. Из формулы (4) видно, что у является суммой двух случайных величин ух и г, из которых первая (ух) пропорциональна х, а вторая (г) с х некоррелирована, так как ковариация жиг равна нулю. Таким образом, дисперсия у представляет собой сумму дисперсий ух и г:
о-2 = yV2 -f о-2. (9)
Если в эту формулу вместо у и о-2 подставить (6) и (7), то первое слагаемое правой части (9) будет равно g2rf, а вторым слагаемым будет (1 — q2) о-2. Как и следовало ожидать, сумма этих слагаемых равна о-2. Таким образом, д2 показывает, какая часть дисперсии случайной величины у приходится на долю слагаемого ух в формуле (4).
Б. ВЫБОРОЧНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ
Если в результате наблюдений получены п пар значений (xi> yi)> ¦ • ¦> (хп> Уп) и если предполагается, что пары (ж„ у{) являются независимыми двумерными случайными величинами с одинаковым двумерным распределением, то в качестве оценки для дисперсии o'L-1-у можно применить выборочную дисперсию
360
Гл. XIII. Корреляция
Поэтому в качестве оценки для ковариации g(a; — х) (у — у) естественно воспользоваться выборочной ковариацией
-L-^(x — x){y — y), (11)