Научная литература
booksshare.net -> Добавить материал -> Биология -> Ичас М. -> "О природе живого: механизмы и смысл " -> 45

О природе живого: механизмы и смысл - Ичас М.

Ичас М. О природе живого: механизмы и смысл — М.: Мир, 1994. — 496 c.
ISBN 5-03-002805-6
Скачать (прямая ссылка): oprirodejivogo1994.djvu
Предыдущая << 1 .. 39 40 41 42 43 44 < 45 > 46 47 48 49 50 51 .. 175 >> Следующая

В. Рост сыновей, отложенный против роста их отцов. Видно, что сыновья высоких отцов тоже проявляют тенденцию быть выше среднего; коэффициент корреляции меньше, чем в случае Б, и равен 0,51.
Г. График, на котором отложены средние значения роста сыновей при разном росте отцов. Средние ложатся гораздо ближе к прямой линии (показанный коэффициент корреляции рассчитан по всем точкам графика В). Если бы рост сыновей всегда был равен росту их отцов, то наклон прямой был бы равен 1; на самом же деле он равен 0,5. Стрелки указывают, что в среднем рост сыновей “регрессирует” к среднему для популяции.
слорода человеком в покое (уровня основного обмена) от веса тела. Как можно было ожидать, при большем весе человек использует в среднем больше кислорода в минуту, но из этого правила есть множество исключений, и поэтому точки довольно сильно разбросаны вокруг прямой. По этой причине такой график называют диаграммой разброса.
Гальтон столкнулся с этой проблемой, изучая наследуемость роста. Его пары данных включали рост родителя и рост потомка. Понятно, что такой материал может быть представлен на двумерном графике (диаграмме распределения). Если между ростом родителей и детей нет никакой связи, точки распределятся случайным образом, а если между этими величинами существует строгая прямая пропорциональность, они будут лежать на прямой линии. На самом деле Гальтон получил промежуточный результат: все точки лежали внутри эллипса с длинной осью, наклоненной вправо (рис. 10-1, В). Такое распределение означает, что по росту дети проявляют тенденцию походить на своих родителей, но из этого правила есть много исключений. Гальтон попытался выразить эту тенденцию количественно.
Общее уравнение прямой линии выглядит так:
у ~ Ь + тх,
где т — наклон, а 6 — значение у при х = 0. Если передвинуть начало координат к средним значениям, 6 будет равно нулю, и мы получим более простое уравнение прямой:
у = тх.
Наклон этой прямой говорит нам о том, в какой мере рост отцов в среднем влияет на рост их детей. Если наклон yfx равен 1/2, то это означает, что потомки отклоняются от среднего значения для популяции вдвое меньше, чем их отцы. Примерно такие результаты и получил Гальтон.
Мы можем определить наклон прямой, откладывая на графике данные для отцов определенного роста против роста их сыновей, как это сделано на рис. 10-1, Г. Все точки в этом случае лежат намного ближе к прямой линии, но некоторый разброс все же наблюдается, и в целом это не лучший способ.
Наша задача — построить линию, которая проходила бы как можно ближе ко всем точкам, и слова “как можно ближе* имеют здесь строго определенный смысл.
Построение линии по точкам. Как бы мы ни проводили линию (кроме случаев точной пропорциональности), некоторые точки на нее ложиться не будут. При выборе “наилучшей” линии
учитывают не сумму отклонений всех точек от данной линии, а сумму квадратов отклонений. Рабочее определение линии, наилучшим образом отражающей совокупность точек, такое: это та линия, для которой сумма квадратов отклонений отдельных точек будет наименьшей. О линии, построенной в соответствии с этим правилом, говорят, что она найдена по “методу наименьших квадратов”.
Решение задачи методом наименьших квадратов кажется довольно сложным, но в действительности вычисление наклона прямой производится весьма просто. Прежде всего находят среднее для всех х (например, для роста родителей) и всех у (для роста потомков). Если мы обозначим отклонение от среднего для каждого единичного случая ж и у как dx и dy, то наклон т “наилучшей” линии можно вычислить по формуле:
_ Е(d'dy) т„„ли* _ "Щ|--
Символ Е означает “сумма”.
Наклон линии наилучшего совпадения называют коэффициентом регрессии. Эта линия позволяет предсказать по данному значению х наиболее вероятное значение у. Отрицательная величина т указывает на обратную пропорциональность: когда одна величина возрастает, другая уменьшается.
Коэффициент регрессии — вещь очень полезная, но сам термин кажется непонятным. Его ввел Гальтон, когда использовал этот метод, чтобы определить, в какой мере сыновья “регрессировали” (т. е. приблизились к среднему показателю для популяции в целом) по сравнению с их отцами, и с тех пор этот термин вошел в употребление.
Корреляция. Коэффициент регрессии т, т. е. наклон линии наилучшего совпадения, в какой-то мере сходен со средней величиной: он указывает, насколько в среднем одна переменная изменяется с изменением другой переменной. А коэффициент корреляции, который всегда обозначают буквой г, служит мерой разброса. Он указывает, насколько выражена эта тенденция к изменению одной переменной при изменении другой. Когда зависимость полная, т. е. когда все точки на диаграмме разброса попадают на одну линию, г = 1, а если зависимости между х и у нет, то г = 0.
Коэффициент корреляции вычисляют по формуле
-
Предыдущая << 1 .. 39 40 41 42 43 44 < 45 > 46 47 48 49 50 51 .. 175 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed