Научная литература
booksshare.net -> Добавить материал -> Физика -> Варден Б.Л. -> "Математическая статистика" -> 154

Математическая статистика - Варден Б.Л.

Варден Б.Л. Математическая статистика — М.: Ил, 1960. — 435 c.
Скачать (прямая ссылка): matematstatistika1960.pdf
Предыдущая << 1 .. 148 149 150 151 152 153 < 154 > 155 156 157 158 159 160 .. 178 >> Следующая


Для вычисления В удобен следующий способ. Применим обычную нумерацию от 1 до я и для каждого индивидуума вычислим разность d порядковых номеров по обоим признакам. Тогда

У л й У л

R = 1 - 2^гТ~ = 1-----• (2)

Q п(п— 1) (п + 1) 4 '

Два качественных признака называются независимыми, если при любом п порядковые номера ? и tj являются независимыми случайными величинами. Таким образом, в случае независимости признаков среднее значение каждого слагаемого в числителе (1) равно нулю, а поэтому g В = 0. Следовательно, если В значительно отличается от пуля, то можно сделать вывод, что признаки являются зависимыми. Для того чтобы уточнить смысл слов «значительно отличается», мы должны будем исследовать, сколь велико может оказаться чисто случайное отклонение В от нуля, когда оба признака независимы. Иными словами, мы должны исследовать функцию распределения В в случае двух независимых качественных признаков.

13. РАСПРЕДЕЛЕНИЕ R В СЛУЧАЕ НЕЗАВИСИМЫХ ПРИЗНАКОВ

Если два качественных признака являются независимыми, то последовательность порядковых номеров nq не зависит от последовательности ?. Последовательности nq представляют собой перестановки всех ?, и для заданной последовательности ? все такие перестановки равновероятны. Каждой перестановке соответствует определенное значение В. Таким образом, независимо от распределения случайных величин ? и nq искомая функция распределения представляет собой вполне определенную ступенчатую функцию, которую при малых п можно легко вычислить, если только иметь необходимое терпение. Например, в случае п = 5 нужно будет вычислить значения В для всех 120 перестановок nq. В действительности, такие расчеты проводились до п = 8; результаты изложены в книге: Kendall М. G., Rank Correlation Methods (London, 1948), Appendix Table 2. При n > 8 расчеты становятся очень утомительными.

В случае независимости признаков среднее значение В равно нулю. Вычислим теперь дисперсию сг2. Из формулы (1) следует, что
§ 70. Коэффициент ранговой корреляции R, по Спирмену 385

Я'2я2 = (2?п,) (2Ш =

i к

QV2 = (?&& = 2 2 & Uh ¦ & -QiVk-i к

Эта сумма содержит п слагаемых с индексами г = к, и так как все индексы равноправны, то все эти слагаемые имеют одинаковые значения. Точно так же оказываются равными друг другу и остальные слагаемые с индексами г ф к; таких слагаемых имеется

п(п—1). Поэтому

QV2 = п <g?f • ? rj{ + п (п — 1) «S fjfa • б rhrj2. (3)

В силу равенства = 0, имеем

о = S&2Ы = Sft + (я- 1) 6

следовательно,

= -Т^п&?1 (4)

и точно так же

Далее,

& V1V2 = — (5)

= Я- (6)

Если от обеих частей (6) вычислить средние значения, то получим

n&a = Q.

То же самое, конечно, справедливо и для г^. Таким образом, и далее, согласно (4) и (5),

& Ь1^2 = 6 Г?1Г?2 = — • (8)

п(п--1)

Если (7) и (8) подставить в (3), то получим Л2 ^2 _ Q1 , Q2 _ Q2

Я п п(п — 1) п — 1

или, после сокращения Q2,

1

п— 1

25 Б. Л. ван дер Варден - 1062

(9)
386

Г л. XIII. Корреляция

Тем же самым методом можно вычислить и четвертый момент В, т. е. матсматичсскос ожидание Л4. Находим

„ D. 3 25я3 — 38и2 — 35п + 72 ,1Л,

вД4= (7^1)3----------26я(и»-1)------ ' (Ю)

В. СРАВНЕНИЕ с НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ

Если в (10) последние два члена — 35п 72 заменить на — 25п + 38 (от этого правая часть (10) изменится лишь очень незначительно), то можно будет числитель и знаменатель сократить па п2— 1. В результате получим

—I (11)

(я—1)2 ( 25п) v '

Сравнение правой части (11) с четвертым моментом нормального распределения, обладающего нулевым средним значением и дисперсией 1/(п—1),

Р-4. = О2)

показывает, что выражения (10) и (12) асимптотически равны и что (10) несколько меньше, чем (12). Так как распределение больших отклонений В в значительной мере определяется средним значением В*, то отсюда следует, что значения В, сильно отклоняющиеся от нуля, возникают с несколько меньшей вероятностью, чем это было бы при нормальном распределении с той же дисперсией.
Предыдущая << 1 .. 148 149 150 151 152 153 < 154 > 155 156 157 158 159 160 .. 178 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed