Научная литература
booksshare.net -> Добавить материал -> Биология -> Ли Ч. -> "Введение в популяционную генетику " -> 18

Введение в популяционную генетику - Ли Ч.

Ли Ч. Введение в популяционную генетику — М.: Мир, 1978. — 557 c.
Скачать (прямая ссылка): vvedenievpopulyacionnu1978.djvu
Предыдущая << 1 .. 12 13 14 15 16 17 < 18 > 19 20 21 22 23 24 .. 263 >> Следующая

Пусть (Xi, Yi) — пары чисел. Каждую пару можно представить точкой на плоскости XY. Проведем прямую, отражающую распределение этих точек на плоскости. Ее уравнение имеет вид
L = a+b{X — X), (1)
где L, в учебниках по статистике обычно обозначаемое через У, Y', Y0 или У с другим индексом, называется предсказанным (predicted), рассчитанным (calculated), теоретическим (theoretical), соответствующим (fitted) или ожидаемым (expected) значением переменной У, определенным по уравнению (1) —уравнению линейной регрессии У на X. Величины а и & из (1) должны быть выбраны так, чтобы сумма квадратов отклонений D — Y—L была минимальной. Минимизировать надлежит следующую величину:
Q = 2D2 = 2(F — L)2= 2[F — a — b{X — Х)]2. (2)
Положив dQ/da = 0 и dQ/db = 0, мы получим два «нормальных» уравнения
2D = 2(F — L) = 2[F — a — b{X — X)] = 0, (3)
2D(X — X) =2 [У — а — Ъ{Х — X)] {Х — Х) =0. (4)
Из них можно вывести все свойства линейной регрессии. Первое дает
4—322
D=Y—L = 0, или a = L=Y, и тогда уравнение (1) можно переписать в виде
L — Z = L — Y = b{X — X). (5)
Подставляя в (4) Y вместо а, мы получим
2 (Г —У) (X — X)— ЪЪ [Х~Х)2 = 0,
откуда
Ь = 2(Y-?)(X-X) = Cov (Y,X)
Е(Х-Х)2 4
b представляет собой тангенс угла наклона искомой прямой регрессии
Y на X. Возведя в квадрат обе части (5) и просуммировав, получим
2 (L — Ъ)2 = b22 (X ¦—X)2,
2 <2 2 /,ш7\
oL = b Ох. (7)
Последнее соотношение сразу же становится очевидным, если мы запишем уравнение (5) в виде L = bX+const.
Следует отметить еще два свойства линейной регрессии. Одно из них состоит в том, что значения L и соответствующие им отклонения D не коррелируют. Из двух нормальных уравнений 2Z) = 0 и —X) =0
следует, что ковариация для D и L также равна нулю:
2 (D — D) [Ь — Z) = bUD (X — X) = 0. (8)
Таким образом,
Y = L + D, <j2=a?+<j2. (9)
Приведенное разложение дисперсии, как это было отмечено выше, ши-
роко применяется в генетике количественных признаков.
Найдем теперь корреляцию между истинным значением Y и значением, вычисленным на основании линейной аппроксимаций L. Ковариация этих двух переменных равна
Сov(Y,L) = E{Y — Y) [L — L] = e{L — L + D — D] [L — L] =
= E{L — l)2 = a2L,
так как E(D—D) (L—L) =0, согласно уравнению (8). Коэффициент корреляции между Y и L равен
_Cov(KiL) = _ai_==_aL
YL~ aYaL aYaL aY '
Поскольку L = bX+const, а коэффициент корреляции не зависит от единиц измерения и начала отсчета, то rYL = rYx- При рассмотрении генетических задач мы будем пользоваться как гуь, так и Гух-
§2. ПРЕДСТАВЛЕНИЕ КОЭФФИЦИЕНТА РЕГРЕССИИ В ВИДЕ СРЕДНЕГО ТАНГЕНСА УГЛА НАКЛОНА
Выше мы показали, что тангенс угла наклона линии регрессии, определенный из нормальных уравнений, есть b = 'L{Y—Y) (X-X)I'Z(X—• —X)2. Интуитивно, однако, неясно, почему отношение Cov (У, Х)/а2х равно тангенеу угла наклона прямой на диаграмме разброса. В этом параграфе мы попытаемся дать непосредственную геометрическую интерпретацию Ь. Пусть Pi= (Xi, Yi), а С=(Х, Y) —соответственно произ-
вольная и некоторая фиксированная точки на плоскости (X, Y). Тангенс угла наклона прямой, проведенной через эти точки, равен
На рис. 3.1 представлены два случая, когда расстояние PC одинаково, а тангенсы углов наклона сильно различаются. Значение тангенса в первом случае, когда длина основания треугольника меньше, определяется с меньшей точностью, чем во втором. Будем считать, что относи-
Рис. 3.1. Вес (ш), соответствующий тангенсу угла наклона, равен квадрату основания треугольника, которое определяет величину тангенса этого угла [388, 388а].
Длины отрезков PC на обеих диаграммах одинаковы, а веса различны.
тельный вес данного тангенса пропорционален квадрату основания, ко-торым этот тангенс определяется. Вес bi равен
w^iX.-X)2.
Тогда средневзвешенный тангенс угла наклона отрезков PC равен [386, 387]
ь = Vbj WC = s(yf-y) (Xt-X) (6,.
Swc s (Xi — xf
что совпадает с величиной, полученной по методу наименьших квадратов (6). __
Введение центральной точки С=(Х, Y) облегчает и упрощает алгебраические выкладки, однако не является необходимым для обоснования соответствия веса тангенсу угла наклона. Вместо введения фиксированной точки С можно взять любую возможную пару точек. При этом тангенс угла наклона отрезка PiPj будет равен
bii = y‘~vJ с весом WU = — Xi)*-
At — Aj
Предыдущая << 1 .. 12 13 14 15 16 17 < 18 > 19 20 21 22 23 24 .. 263 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed