Научная литература
booksshare.net -> Добавить материал -> Биология -> Рокицкий П.Ф. -> "Биологическая статистика " -> 51

Биологическая статистика - Рокицкий П.Ф.

Рокицкий П.Ф. Биологическая статистика — М.: Высшая школа, 1973. — 320 c.
Скачать (прямая ссылка): biologicheskayastatistika1973.djvu
Предыдущая << 1 .. 45 46 47 48 49 50 < 51 > 52 53 54 55 56 57 .. 123 >> Следующая

первого взгляда может показаться, что величина >, близкая к 0,5, является
достаточно высоким коэффициентом корреляции и что в этом совпадение
вариации двух признаков должно быть в 50% случаев. На самом деле это не
так. Даже при полном отсутствии корреляции будут случаи, когда отклонения
от средних по обоим признакам для данной особи окажутся примерно
одинаковыми, иначе говоря, когда по обоим признакам особь будет
находиться примерно в одном и том же месте вариационного ряда. Так, из
рис. 11, а видно, что некоторые группы вариант расположены в одних и тех
же порядковых классах общих рядов х и у, например в классах "3" и "3",
"5" и "5" и т. д.
Таким образом, и при отсутствии корреляции будет наблюдаться в силу
закономерностей случайной вариации как случайное совпадение в вариации
двух признаков, так и случайное несовпадение, примерно в равном
соотношении. При наличии
120
о
ООО
о о о О о
0 О О О О О о
О О О О О
ООО
о
1 I I I
г=0
- о о о
- о О о о
- о о о О О
о о о о о
- о о о о о
о - о о о
- о о о г= + 0,5
5
- о О о
- о о о о
-1- о о о о о
о о о о о
- о о о о о
- о о о о
I ¦ ' ч 1 Л - ч 1_ о о -о -
г
- о
о
- о
- о
- о
- о
г-- '1.0 1 О
12 3 4 5 6 7
д ?
Рис. 11, Распределение вариант в корреляционных решетках при корреляциях,
отличающихся по знаку и величине.
же корреляции какая-то доля изменчивости одного признака будет вполне
закономерно определяться изменчивостью другого признака. Оказывается, что
степень "связанности" в вариации двух величин более точно измеряется
квадратом коэффициента корреляции, т. е. г2. Это значит, что при г = 0,5
25% вариации одного признака объясняется вариацией другого признака, по
остальной же части вариации соотношение между признаками чисто случайное.
При г=0,3 менее 10% изменчивости объясня-
121
ется таким же образом. При г=0,7 около 50% изменчивости одного признака
определяется изменчивостью другого признака. При таком же коэффициенте
корреляции, как 0,9, 81 % вариации одного признака закономерно связан с
вариацией другого признака, в остальных же 19% случаев совпадение или
несовпадение вариаций двух признаков чисто случайно.
Таким образом, хотя коэффициент корреляции и указывает на общность
элементов в двух коррелированных рядах, но не вся эта общность
объясняется закономерной связью в вариации двух признаков.
Из сказанного ясно, что о тесной корреляции можно говорить только в тех'
случаях, когда г не ниже 0,7. Коэффициенты корреляции порядка 0,5-0,6
следует считать средними, коэффициенты же ниже 0,5 указывают на слабую
связь.
Выборочность коэффициента корреляции. Оценка его достоверности.
Фактически полученный коэффициент корреляции г всегда является
выборочным, так как он вычисляется на основе ограниченной совокупности,
представляющей выборку из генеральной. Поэтому он имеет свою ошибку -
ошибку выборочности. Эта ошибка будет мерой расхождения между г и
коэффициентом корреляции для генеральной совокупности р (греческое ро).
Таким образом, определив среднюю ошибку, можно судить о степени
достоверности г. Согласно нулевой гипотезе, р=0, т. е. признается, что в
генеральной совокупности нет корреляции между варьирующими признаками.
Тогда
При значении t, удовлетворяющем определенной вероятности (0,95 или 0,99),
можно считать нулевую гипотезу отвергнутой, т. е. признать данное
значение г достоверным. .
Таким образом, для оценки достоверности выборочного коэффициента
корреляции надо вычислить среднюю ошибку коэффициента корреляции.
Однако по отношению к коэффициенту корреляции вопрос о средней ошибке
обстоит, значительно сложнее, чем по отношению к средней арифметической.
Выборочные средние, как указано в гл. 4, распределяются вокруг средней
арифметической р. в соответствии с нормальным законом, и это было
основанием для формулы ошибки средней арифметической.
Распределение же выборочных коэффициентов корреляции, оказывается, далеко
не всегда следует нормальному закону. Поэтому вычисление средней ошибки
для г связано с известными трудностями, а иногда даже приходится
пользоваться окольным методом - переводом г в число z (о числе z см.
ниже).
При больших выборках (в данном случае при п>100) и при не очень высоком
коэффициенте корреляции среднюю ошибку для г можно вычислить по формуле
122
(44)
Тогда
* = тй- <45>
Для вычисленного ранее коэффициента корреляции между удоем коров за
лактацию и процентом жира в молоке, равного - 0,38,
s, = --~(^8)2 = 0,0856 " 0,09,
t - = 42
' 0,09
Очевидно, что коэффициент корреляции обладает высокой достоверностью.
Уровень значимости ниже чем 0,01. Нулевая гипотеза, что р=0,
опровергается.
Распределение г при малых выборках и при очень малых или больших его
значениях может значительно отличаться от нормального, поэтому применение
формулы (44) в таких случаях может привести к неверной оценке
достоверности коэффициента корреляции. Оказались необходимыми более
Предыдущая << 1 .. 45 46 47 48 49 50 < 51 > 52 53 54 55 56 57 .. 123 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed