Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 59

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 53 54 55 56 57 58 < 59 > 60 61 62 63 64 65 .. 183 >> Следующая

Пример 3.1.1 (продолжение). Так как в этом примере повтор ные измерения были сделаны для каждого из к = 5 значений X, можно проверить адекватность простой линейной модели с а= 0.05.
3.1. Линейная регрессия н корреляционный анализ
157
Таблица расширенного дисперсионного анализа приведена ниже. Заметим, что = 20.945 = БЭл, + ББда яvR = 18 = ул + + vw. Так как Р0 = 1.27 < Р0.95 (3, 15), нулевая гипотеза принимается.
Источник дисперсии Сумма квадратов Число степеней свободы Средний квадрат .Р-отио-шение
Регрессия 793.099 1 293.099 1.27
Отклонение от регрессии 4.251 3 1.417
Внутригруппоьой разброс 16.694 15 1.113
Полная 814.044 19
3.1.4. Коэффициент корреляции
В этом разделе обсуждается выборочный и популяционный коэффициенты корреляции. Эти величины были введены в гл. 2 как меры линейной зависимости между двумя пе?еменньщи. Как было указано ранее, Статистические выводы~отнЬсительно популя-ционного коэффициента корреляции можно сделать, только если и X и V" суть случайные величины. В частности, если совместное распределение X и У есть двумерное нормальное распределение, популяционный коэффициент корреляции и модель линейной регрессии соотносятся с этим распределением весьма интересным образом. Обратимся теперь к соответствующей теории.
Предположим, что случайные величины X и У имеют двумерное нормальное распределение. Пусть цл и цу будут средними для "популяции, а а| и оу — дисперсиями X и У. По-пуляционную ковариацию X и У обозначим через аху. Тогда простой (или смешанный момент) коэффициент корреляции между X и У есть
Р = оху/(охоу). (3.1.25)
Этот коэффициент есть мера линейной зависимости между X и У. Значения р заключены в пределах от ¦—1 до +1. Положительное значение р указывает, что У имеет тенденцию возрастать совместно с X, в то время как отрицательное р указывает на тенденцию У к убыванию с ростом X. Экстремальные значения р = ±1 соответствуют полной линейной зависимости между X и У, так что при данном X = х значение У точно определено.
Для данного значения Л^.х имеется подпопуляция значений У, соответствующих X = х. Их распределение, называемое условным распределением У при данном Х=х, есть одномерное нормальное распределение со средним
Рух = Ру + -Е*г(х-Рх). (ЗЛ-26)
ах
158 Гл. 3. Регрессионный и корреляционный анализы
которое называется условным средним значением У при данном X = х (или регрессией У по X). Дисперсия этого распределения, называемая условной дисперсией У при данном X = х, есть
а2 = а|,(1-р2). (3.1.27)
Это последнее выражение позволяет дать весьма важную интерпретацию для_р- Заметим, что а\ есть безусловная дисперсия У, т. е". "это дисперсия У, когда значение X неизвестно. С другой стороны, о2 есть условная дисперсия У, т. е. это дисперсия У, когда известно, что соответствующее значение X = х. Итак, из выражения (3.1.27) следует, что сокращение дисперсии У, обусловленное знанием X, есть
Ст2_ста = р2ст2 (3.1.28)
Из этого равенства мы получаем
р* = (а\ - о*)Ю1, (3.1.29)
\ откуда следует, что квадрат коэффициента корреляции^равен доле дисперсии У, объясненной знанием X.
<* • Определим теперь случайную величину е = У — которая измеряет отклонение У от ее среднего значения при фиксированном X = х. Условное распределение е при данном X = х есть нормальное распределение со средним значением 0 и дисперсией о2. Поэтому можно записать
У = Пух + е = цу - Щ- ух + х + е = Ро + М + е, (3.1.30)
ах ах
где
Ро = М*-Р1И,, Р1 = ^Ь (3-1.31)
°х
и е распределено как N (0, а2). Заметим, что это уравнение имеет ту же самую форму, что и уравнение простой линейной регрессии У и X (3.1.10). Таким образом, теория, развитая в разд. 3.1.1 — 3.1.3, применима к этой модели.
'¦ Отметим, что, как следует из (3.1.29), квадрат коэффициента . корреляции равен доле дисперсии У, «объясненной» линейной регрес-к сией У по X. Когда р = 0, то а2 = а\. Это означает, что никакая доля дисперсии У не объясняется регрессией У по X. Когда р= = ±1, то а2 = 0. Таким образом, вся дисперсия У объясняется регрессией У по X, т. е. зависимость между У и X в точности линейная.
Рассмотрим теперь оценивание параметров популяции. Предположим, что имеется случайная выборка (х1, у,), (х2,уг), ... (хп, уп), которая порождена согласно второму типу, описанному
3.1. Линейная регрессия и корреляционный анализ
159
в начале этого раздела, так что X и У суть случайные величины. Оценками для \1Х, \1У, а%, о\, аху, р будут соответственно х, у, 4. Ьху, г- Далее, оценками р„, рх и ста будут соответственно Ь0, Ьх и я2. Таким образом, эти величины получаются в программах регрессионного анализа как выборочные средние, дисперсии, ковариации, корреляции, свободный член, коэффициент регрессии и дисперсия оценивания соответственно.
Пример 3.1.2 (продолжение). В этом примере X и У суть рН венозной и артериальной крови, измеренные у 108 пациентов в критическом состоянии. Выборочные оценки, полученные с помощью дескриптивной программы, приведены в примере 2.3.1 и объединены здесь для удобства:
х ==7.373, у =7.413, 5|-0.1253, 8$ =0.1184,
Предыдущая << 1 .. 53 54 55 56 57 58 < 59 > 60 61 62 63 64 65 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed