Научная литература
booksshare.net -> Добавить материал -> Биология -> Рокицкий П.Ф. -> "Биологическая статистика " -> 47

Биологическая статистика - Рокицкий П.Ф.

Рокицкий П.Ф. Биологическая статистика — М.: Высшая школа, 1973. — 320 c.
Скачать (прямая ссылка): biologicheskayastatistika1973.djvu
Предыдущая << 1 .. 41 42 43 44 45 46 < 47 > 48 49 50 51 52 53 .. 123 >> Следующая

среднего квадратического отклонения. Выражая отклонения отдельных особей
от средних арифметических по обоим признакам .одновременно, можно
сопоставлять вариацию по обоим признакам.
Допустим, например, что мы хотим выяснить, насколько связанно варьируют у
лисиц длина туловищачх и длина хвоста у. Для этого сопоставим значения t
по х и по у для некоторого количества лисиц:
109
№1 №2 №3 №4 №5 №6 №7
tx +2,0 +0,8 -0,4 +1,2 +0,2 -1,7 -2,7
ty -f- 1,8 -j- 0,9 -OjS' -f- 1,3 -f- 0,3 - 1,4 -2,9 и
т. д.
Ясно, что чем теснее связана вариация по этим двум признакам, тем чаще
совпадут значения t обоих признаков и по знаку, и по количественному
значению. Места, занимаемые ими в вариационных кривых длины туловища и
длины хвоста, будут примерно одинаковыми. Наоборот, при отсутствии
корреляции совпадение величин t по обоим признакам будет чисто случайным.
Таким образом, зависимость между t обоих рядов, т. е. между величинами tx
=-- и tv = - (или отношение между
ах ^ . у
ними), может быть мерилом корреляционной связи.
Оказалось, что нормированные отклонения обладают рядом ценных
математических свойств. Приведем некоторые из них в готовом виде без
математического обоснования.
Первое свойство заключается в том, что среднее произведение двух
нормированных отклонений, т. е.
можно записать и в иной форме, а именно: txty. Черта наверху,
охватывающая обе буквы, будет обозначать, что взята средняя.
При полном отсутствии связи между изучаемыми признаками tjy = 0, а при
полной, т. е. уже функциональной, связи между признаками tjy = 1.
Второе свойство среднего произведения t заключается в том, что его знак
будет разным в зависимости от типа связи: если увеличивающемуся значению
одного признака соответствует увеличивающееся значение второго -
знак/mnpc, если с увеличением значения одного признака значение этороЬ)
уменьшается - знрк минус.
* Наконец, оказалось, что теми же свойствами характеризуется не только
среднее произведение tytx, но и их -среднее отношение
Квадратные скобки в данном случае означают, что отношение также берется в
среднем.
Вот почему обе эти величины были приняты как мерило тесноты
корреляционной связи двух признаков и получили название коэффициента
корреляции, который обозначается буквой г. ¦
колеблется от 0 до 1.
Среднее произведение нормированных отклонений
110
Таким образом,
Г tx'ty
ИЛИ
Последнее выражение мы сейчас рассматривать не будем. Укажем только, что
оно приводит к так называемому основному корреляционному уравнению, или
уравнению регрессии ty=rtx, преобразование которого дает обычное
уравнение прямой у - а + Ьх. С ним мы познакомимся в гл. 6, когда будем
говорить о регрессии.
Первое же выражение является общим " видом формулы, применяемой при
вычислениях простого коэффициента корреляции
Г = Щ±. (37)
Так как
то
, _ (*i- *) . f .... (Hi - у)
lJC " " Ly >
°у
г = . (38)
п ОдОу
В формуле (38) величина х,- х обозначает отклонение каждой изучаемой
особи от средней- х одного признака, распределённого по ряду х, а
величина у( - у - отклонение той же особи от средней у другого признака,
выражающегося рядом у. Таким образом, для того чтобы получить числитель,
надо учесть отклонения каждой особи от средних по обоим признакам,
перемножить их и затем просуммировать. В знаменателе же формулы уже изг-
вестные величины: п - число особей, ах - среднее квадратическое
отклонение ряда по признаку х (или просто ряда х) и ау - среднее
квадратическое отклонение ряда по признаку у (ряду у).
Рабочие формулы для вычисления коэффициента корреляции. Практически можно
использовать как приведенную выше общую формулу (38), так и ее
видоизменения, которые легко получить путем алгебраического
преобразования числителя и знаменателя.
Существует довольно много различных рабочих формул для вычисления г
прямым способом, т. е. при непосредственном использовании отдельных
значений х, и соответствующих им у*. Одной из наиболее часто
примё'няемВгх формул является следующая:
r = 4 (39) У 2(*<-*)*2(у,-# \
Эта формула получена путем простого преобразования формулы (38), где
вместо ах и "^подставлены назначения
Ш
i/1!#
Коэффициент корреляции в данном случае выражен только с помощью
отклонений от средних, так что все вычисления становятся однотипными.
В качестве примера вычисления коэффициента корреляции по формуле (39)
используем данные о весе 10 петушков 15-дневного возраста х и весе их
гребешков у. Они обработаны в табл. 20 таким образом,' чтобы все нужные
для формулы величины были выражены в' отклонениях от средних
арифметических. Тогда
2302 _ 2302 _ , Л 07
KlOOO-6954 2637 U,o/.
Таблица 20
Данные для вычисления коэффициента корреляции между весом тела х (в г) 10
петушков 15-дневного возраста и весом их гребешков у (в мг)
Номер пар *t У1 Xi - X (xt- * )2 У~У (У - У )а (Xi-X) (У1
- У)
1 83 56 0 0 -4 16 0
2 72 42 t -11 121 - 18 324 198
3 69 18 -14 196 -42 1764 588
4- 90 84 7 49 24 576 168
5* 90 56 7 49 -4 16 -28
Предыдущая << 1 .. 41 42 43 44 45 46 < 47 > 48 49 50 51 52 53 .. 123 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed