Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 63

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 57 58 59 60 61 62 < 63 > 64 65 66 67 68 69 .. 183 >> Следующая

168
Гл. 3. Регрессионный и корреляционный анализы
Пусть В = (60, 6р)' — вектор параметров размера (р + + 1) X 1, у = (ух, у„)' — вектор из п наблюдений, е = = (ех, еп)' — вектор из п ошибок и
X =
1 X,,
1 х12 І х,.
КР1
есть п X (р + 1)-матрица плана. Уравнение (3.2.4) можно теперь записать в виде
у = Х'В + е,
где е имеет многомерное нормальное распределение N (0, аЧ). Выражение (3.2.5) можно представить в матричном виде: 5 = = (у — Х'Р)' (у — Х'В), а вектор МНК-оценок Ь = (&„, Ьх, Ьр)' получается из решения системы нормальных уравнений (XX') В = = Ху. Решение этой системы имеет вид Ь = (XX')"1 (Ху), а его ковариационная матрица равна Соу (Ь) = о2 (XX')-1. Наконец, несмещенная оценка дисперсии есть
МБК = в2 = (у - Х'Ь)' (у - Х'Ь)/(л - р - 1). *
2. Существует «центрированная» форма модели множественной линейной регрессии, которая является обобщением центрированной простой линейной регрессии, рассмотренной в разд. 3.1. Центрированная модель задается уравнениями
У1 = Ро + р! (хи — х{)-\----+ РР (хР1 — хр) + ей 1=1,..., я,
где
п
*/=4~ 2 х'к' 1=1' ¦ ¦ *'р и =Ро+рл н—+$рхр.
МНК-оценками для рг, рр будут, как и раньше, Ьх, ЬР, в то время как МНК-оценкой для Ро будет Ь'0 = у. Преимущество этой модели заключается в том, что оценки Ьх, Ъв не коррели-рованы с Ь'й. Можно показать, что это упрощает нахождение доверительных интервалов для предсказанного значения у = у + + Ьх (хх — хх) + ... + Ьр (хр — хр).
•к 3. В матричных обозначениях центрированная модель выглядит следующим образом. Пусть А есть рхр-матрица сумм квадратов и смещенных произведений отклонений с элементами
п
Щ] = И (хгк — *«) {х}к — х}), I, / = 1, .... р, а g есть (рX 1)-вектор
к=1
3.2. Множественная линейная регрессия и корреляции
169
п
с 1-м элементом & = ? (ук — у) (х1к — х{), I = 1, р. Тогда вектор МНК-оценок
Ь = (Ьг, .... Ьр)' = А~%
Кроме того,
Соу(Ь) -= о2А~х и cov (у, 6,) = 0, / = 1, . . ., р. ?
4. Если в оценку регрессионного уравнения в качестве значений хи хр подставляются средние значения хх, хр, то предсказанное значение # = у.
Пример 3.2.1. Экспериментально изучалось октановое число бензина, содержащего различные концентрации двух добавок А и В. Пусть У — октановое число, Хх — процент первой добавки и Х% — процент второй добавки. Предполагалось, что эффекты добавок А и В складываются, так что для описания зависимости У от Хх и Х2 использовалась множественная линейная регрессия Ш^- §° р!*1 "т" + е. Каждая из двух независимых переменных принимала одно йТчетырех фиксированных значений, а значение У определялось для каждой комбинации значений Хх = хг и Х2 = хг. Анализируемые данные приведены в таблице.
Хг У Хі х2 У
2 2 96.3 4 2 96.2
3 95.7 3 100.1
4 99.9 4 103.2
5 99.4 5 104.3
3 2 95.1 5 2 97.8
3 97.8 3 102.2
4 99.3 4 104.7
5 104.9 5 108.8
С помощью программы множественной регрессии из ПСП были получены оценки Ь0 — 84.553, Ьх — 1.833 и Ь% — 2.683. Таким образом, оценка уравнения множественной регрессии есть у = = 84.553 + 1.833*! + 2.683х2. Таблица дисперсионного анализа для этого примера имеет следующий вид:
Источник дисперсии Сумма квадратов Степени свободы Средний квадрат Р-отношеиие
Регрессия 211.084 2 105.542 54.487
Отклонение от ре- 25.182 13 1.937
грессии
Полная 236.266' 15
170 Гл. 3. Регрессионный и корреляционный анализы
Таким образом, несмещенная оценка дисперсии ошибки о2 есть МЭк = 1.937, а стандартная ошибка оценки в = I/1.937 = 1.392. Наконец, отношение #2 = 550/55т = 211.084/236.266 = 0.893 есть доля дисперсии, объясненная регрессией У по Хх и Хг.
3.2.2. Доверительные интервалы и проверка гипотез
Кроме МНК-оценок для параметров р\, р„, программы множественной регрессии из ПСП вычисляют ряд величин, которые используются для построения доверительных интервалов и проверки гипотез относительно параметров. Эти величины называются стандартными ошибками коэффициентов. Для каждого р, стандартная ошибка коэффициента ее есть оценка стандартного отклонения оценки Ьь от рг, г = 1, р. Так как каждая из этих величин является функцией от М5К и имеет л>к = п — р — 1 степеней свободы, то 100 (1 — а) %-ный доверительный интервал для рг есть
^ ± ве _ (а/2) (^н), 1 = 1, . . ., р. (3.2.9)
Некоторые программы вычисляют также стандартную ошибку свободного члена ее (&„). В этом случае выражение (3.2.9) может быть использовано и при I = 0. По этому вопросу см. также замечание 3.2.2.2.
Гипотезы относительно коэффициентов р\, (Зр делятся на три категории: можно проверять, что все коэффициенты равны: рх = = р2 = ... = рр = 0; можно проверять равенство р& = 0 для любого одного &-го коэффициента, & = 1, р; или можно проверять гипотезу о том, что некоторое подмножество из т коэффициентов равно нулю, 1 < т < р.
Гипотезу Я„: р] = ... = (5р = 0 можно рассматривать как гипотезу о том, что «независимые переменные Хъ Хр не улучшают предсказание У относительно у = у». Если эта гипотеза не отвергается, то, следовательно, у принимается как лучшее предсказываемое значение У. Альтернативная гипотеза состоит в том, что не все коэффициенты равны нулю, т. е. что «некоторые из независимых переменных улучшают предсказание У по сравнению с р = у». Статистикой критерия является /^-отношение, данное в последней колонке таблицы дисперсионного анализа (табл. 3.2.1), т. е.
Предыдущая << 1 .. 57 58 59 60 61 62 < 63 > 64 65 66 67 68 69 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed