Научная литература
booksshare.net -> Добавить материал -> Биология -> Рокицкий П.Ф. -> "Биологическая статистика " -> 53

Биологическая статистика - Рокицкий П.Ф.

Рокицкий П.Ф. Биологическая статистика — М.: Высшая школа, 1973. — 320 c.
Скачать (прямая ссылка): biologicheskayastatistika1973.djvu
Предыдущая << 1 .. 47 48 49 50 51 52 < 53 > 54 55 56 57 58 59 .. 123 >> Следующая

отношении корреляционной зависимости высоты в холке и живого веса не
может быть отброшена.
Доверительные границы для р. Если достоверность выборочного коэффициента
корреляции г доказана, то с помощью средней ошибки можно установить
доверительные границы для коэффициента корреляции р той генеральной
совокупности, из которой взята выборочная совокупность. В некоторых
случаях (когда п достаточно велико, а г близко к 0,5) это можно сделать
тем же способом, который применялся для установления доверительных границ
для р, т. е. путем вычитания или прибавления 2 (или 3) ошибок по общей
формуле:
г - tsr < р < г + tsr. (50)
Так, при г=0,38 и sr=0,09 (п= 100) доверительные границы для уровня
значимости />=0,05 будут:
0,38-2 • 0,09 < р<0,38+2 • 0,09;
0,20<р<0,56.
Однако, учитывая, что распределение величины г более близко к
нормальному, чем распределение г, лучше определять доверительные границы
с помощью г по формуле
z - fc* < z0 < z + tsz. (50а)
В дальнейшем z переводятся в г. Допустим, что при п=12 было получено г-
0,82. Тогда z=l,16.
Ошибка для
s, = - 1 -- = JL = i- = о.зз.
* /12 - 3 /9 3
При Р = 0,05 для доверительных границ достаточно взять t-2.
Определяем доверительные границы для Zo генеральной совокупности по
формуле (50а):
1,16-2-0,33<z0< 1,16 + 2- 0,33;
0,50<z0<l,82.
Теперь определяем граничные значения г по г в обратном порядке и получаем
доверительные границы для р:
0,46<р<0,95.
Границы для р очень велики. Кроме того, существенно, что полученное для
выборочной совокупности значение г(-0,82) находится не посредине между
максимумом и минимумом, а ближе к максимуму. Это значит, что
распределение г асимметрично. Определение доверительных границ
непосредственно по г дало бы очень неточные результаты.
126
Из всего сказанного следует очень важный для биолога вывод, что даже
достоверным значениям выборочных коэффициентов корреляции нельзя
придавать абсолютное значение и что надо учитывать возможную их
колеблемость по отдельным выборкам.
Коэффициент ранговой корреляции. Для вычисления обычного коэффициента
корреляции необходимо, чтобы исходные данные были выражены достаточно
точно. Однако это далеко не всегда возможно. Существуют такие
количественные признаки, которые с трудом поддаются точной оценке. Кроме
того, распределение одного или обоих коррелирующих признаков может быть
очень неравномерным и неправильным.
Эти трудности можно обойти, если применить оценку вариант по каждому
признаку порядковыми номерами от меньших значений к большим (или
наоборот). Порядковый номер по каждому признаку является его рангом.
Отсюда название этого метода - определение коэффициента ранговой
корреляции (или коэффициента корреляции рангов). Существует 2
коэффициента ранговой корреляции - Спирмэна и Кендэла. О коэффициенте
Кендэла можно найти данные в специальной литературе.* Поэтому ограничимся
разбором коэффициента Спирмэна.
Для коэффициента ранговой корреляции Спирмэна примем обозначение г*.
•Формула для его вычисления следующая:
_ 1 62 (х, - у jf f51
п(п* - 1) ' I '
где Xi и у{ - ранги по первому и второму признаку, п - число пар
коррелируемых величин.
Разницу рангов можно обозначить буквой й.
Тогда
до
* n(n2 -1) •
В качестве простейшего примера использования коэффициента ранговой
корреляции Спирмэна приведем следующий. В одном из районов Львовской
области появились случаи заболевания безжелтушным лептоспирозом (водной
лихорадкой). Можно было предположить, что повышенный процент заболеваний
бывает в месяцы с большим количеством осадков. Для установления этой
связи следует сопоставить среднее количество осадков в июле и августе (за
несколько лет) и количество заболеваний лептоспирозом в эти же месяцы
данного года (табл. 25).
Казалось бы, по данным табл. 25 можно вычислить обычный коэффициент
корреляции. Однако оба признака очень неустойчивы. Поэтому лучше выразить
их вариацию в рангах, что и сде-
• См. Ван дер Варден Б. Л. Математическая статистика; Юл Дж. Э" Кендэл М.
Дж. Теория статистики.
127
Таблица 25
Количество заболеваний лептоспирозом и количество осадков за данный месяц
(данные упрощены)
Количество
заболеваний
х
Количество
осадков
У
Оценка рангов
XI
У1
d2
0 19
4
1 2
68
131
14
11
2
54
101
185
85
30
128
143
74
28
132
1
8
5 2
3.5
9
10 7
6
3.5
3 6
10
5
2
7 9
4 1
8
-2 2
-5 -3 + 1,5 +2 +1 +3 +5 -4,5
4
4
25
9
2,25
4
1
9
25
20,25
/2 = 10
2d2 = 103,50
лано в 3-й и 4-й графах таблицы. В тех случаях, когда встречаются
одинаковые значения признаков, надо сложить их ранги и записать средний
ранг, как это сделано с дважды повторявшимися в таблице двумя больными.
Они оценены рангами 3,5 и 3,5.
Коэффициент ранговой корреляции будет равен
6-103,50 == 1 _^=1_0бз = 0)37.
Г" = 1
10(10*- 1) - ' 990
Оценка достоверности rs несколько затруднительна, так как распределение
ранговых коэффициентов может еще более отклоняться от нормального, нежели
распределение простых г. Поэтому для п>8 пользуются готовыми таблицами
Предыдущая << 1 .. 47 48 49 50 51 52 < 53 > 54 55 56 57 58 59 .. 123 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed