Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
пд0+ [ж] 01 = [у\, | (4)
[ж] + [жж] ^1 = [ху\ \
Для линии регрессии г-го порядка аналогичным образом получается система [г + 1) нормальных уравнений
v ?0 + [ж] ?i -г ... + Ог] = [у], \
[ж] ?0 -f [ж2] ч + • ¦ • + Or+1l ^ = O^L (
.............................................. ( (5)
O'] + О'+Ч 01 + . . . + О2'] 0Г = O'y]. )
Отыскание уравнения регрессии посредством решения системы (5) сопряжено с большим количеством утомительных вычислений. Правая часть уравнения регрессии представляет собой линейную комбинацию многочленов 1, ж, ж2, . . ., хТ. Если эти многочлены предварительно ортогонализированы, то при отыскании уравнения регрессии количество вычислений существенно сокращается. Две функции <р(ж) и тр(ж), определенные в точках хг, . . ., ж„, называются ортогональными, если
2 Фд W(xi) = о.
Если теперь нам заданы т функций 951, <р2, . . ., срт, то их можно заменить системой ортогональных функций трг, тр2,. . ., трт, определяемых соотношениями1
Vi = <h,
Vz — V* — « Vi.
Vs = <Рз — P Vi — У У>г,
1 Предполагается, что все т векторов<Pfc(-rn)] (k = 1, 2,..., тп) линейно независимы. — Прим. псрев.
§ 33. Линии регрессии
177
Постоянная а определяется таким образом, чтобы щ и ip2 были ортогональны; постоянные /3 и у определяются двумя условиями ортогональности: гр3 к и гр3 к у2 и т- Д-Любую линейную комбинацию
01 91 + . . . + $т <Рт
можно записать как
Mi Vi + ¦••+ Рт Ут¦.
Если теперь для определения ju. снова воспользоваться методом наименьших квадратов, то каждое нормальное уравнение будет содержать лишь какое-либо одно неизвестное jщ, и поэтому решение можно выписать непосредственно, минуя утомительные вычисления, связанные с решением системы (5).
В случае линейной регрессии вычисления выполняются так: исходными функциями равенства (1) являются 1 и ж, а соответствующими ортогональными функциями
у)0 = 1 и щ = х — х,
где х — арифметическое среднее всех х,.
Дифференцированием устанавливаем, что сумма квадратов
2 (У — PoVo — Рт)2
достигает наименьшего значения при тех значениях (л0 и которые удовлетворяют уравнениям
— 2 УЧ>о + Мо 2 Vo = )
— 2yvi + th.2y^ = o j
или
Роп = 2 У> )
jlij 2 (х — х)2 = 2 у (* — *)¦ ’
(6)
(7)
Если, ради простоты обозначений, положим т0 = ju.0 и т, = /хл, то решения уравнений (7) можно записать в виде
™0 = У = \2У’ (8)
_ 2 (х — х)у _ 2 (х — х) (у — V) /д\
1 ^-1 — X ч . — * ' '
Л. (х — аг)2 ^ (х — х)2
Формула
у — у=т1(х—х) (10)
называется уравнением эмпирической линии регрессии. Эта линия
представляет собой прямую с угловым коэффициентом тл, который является случайной величиной и называется выборочным коэффи-
12 Б. Л. ви:: дер Варден * 1062
i
1865
1866
1867
1868
1869
1870
1871
1872
1873
1874
1875
1876
1877
1878
1879
1880
1881
1882
1883
1884
1885
1886
1887
1888
1889
1890
1891
1892
1893
1894
1895
1896
1897
1898
1899
1900
1901
1902
1903
1904
1905
1906
1907
1908
1909
1910
Гл. VII. Метод наименьших квадратов
X У t --- а у --- Ъ U - а)'
9,10 959 ---25 ---441 625
9,66 985 ---24 ---415 576
10,06 1003 ---23 ---397 529
10,71 1030 ---22 ---370 484
11,95 1077 ---21 ---323 441
12,26 1088 ---20 ---312 400
12,85 1109 -19 ---291 361
14,84 1172 --- 18 ---228 324
15,12 1180 --- 17 ---220 289
13,92 1144 --- 16 ---256 256
14,12 1150 --- 15 ---250 225
13,96 1145 --- 14 ---255 196
14,19 1152 --- 13 ---248 169
14,54 1162 --- 12 ---238 144
14,41 1159 --- 11 ---241 121
18,58 1269 --- 10 --- 131 100
19,82 1297 --- 9 --- 103 81
21,56 1334 --- 8 --- 66 64
21,76 1338 --- 7 --- 62 49
20,46 1311 --- 6 --- 89 36
19,84 1298 --- 5 --- 102 25
20,81 1318 --- 4 --- 82 16
22,82 1358 --- 3 --- 42 9
24,03 1381 --- 2 --- 19 4
25,88 1413 --- 1 + 13 1
27,87 1445 0 45 0
26,17 1418 1 18 1
26,92 1430 2 30 4
25,26 1402 3 2 9
26,03 1416 4 16 16
29,37 1468 5 68 25
31,29 1495 6 95 36