Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 54

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 48 49 50 51 52 53 < 54 > 55 56 57 58 59 60 .. 183 >> Следующая

Регрессионный анализ используется по двум причинам. Во-первых, потому, что описание зависимости между переменными помогает установить (наличие возможной причинной связи. Во-вторых, для получения предиктора для зависимой переменной, так как уравнение регрессии позволяет предсказывать значения зависимой переменной по значениям независимых переменных. Эта возможность особенно важна в тех случаях, когда прямые измерения зависимой переменной затруднены или дорого стоят.
142
Гл. 3. Регрессионный и корреляционный анализы
Величина линейной зависимости между двумя переменными измеряется посредством простого коэффициента корреляции,^ то время как величина линейной зависимости одной переменной от нескольких измеряется множественным коэффициентом корреляции. Другая мера зависимости — частный коэффициент корреляции — измеряет линейную зависимость между двумя переменными после устранения части линейной зависимости, обусловленной зависимостью этих переменных с другими переменными. Методы корреляционного анализа позволяют делать статистические выводы об этих трех мерах линейной зависимости. В данной главе будет показано, что методы регрессионного и корреляционного анализов тесно связаны между собой.
Раздел 3.1 посвящен линейной регрессии зависимой.переменной по одной независимой переменной, т. е. простому линейному регрессионному анализу и связанному с ним простому корреляционному анализу. В разд. 3.2 рассматривается множественный линейный регрессионный анализ, а также анализ множественных и частных корреляций. В этом случае имеется несколько независимых переменных. В разд. 3.3 рассматривается процедура пошаговой регрессии для выбора наилучших независимых переменных для прогнозирования зависимой переменной. Наконец, разд. 3.4, посвящен нелинейному регрессионному анализу.
Теорию, лежащую в основе регрессионной модели, можно получить из теории общей линейной модели. Так как последняя включает и основы дисперсионного анализа, она будет рассмотрена в гл. 4. Обзор программ вычисления регрессии содержится в работе УеПетап е1 а1. (1977).
3.1. Простая линейная регрессия и простой корреляционный анализ
В этом разделе будет рассмотрена ситуация, когда две переменные связаны линейным соотношением. Пусть У—зависимая, а X — независимая переменные.
Предположим, что имеется выборка парных наблюдений (хи Ух)> (*2. #г). •••> (хп' У,г) из некоторой популяции Ш. Первый способ состоит в том, что значения X фиксируются, скажем X = = хъ X = хп, так что для X == хг мы имеем подпопуляцию из №, содержащую все индивидуумы, для которых X = хи I = 1, п. Из случайным образом выбирается индивидуум, у которого измеряется У = у и I — 1, п. При таком подходе только У является случайной величиной.
3.1. Линейная регрессия и корреляционный анализ
143
При втором методе получения выборки, мы случайным образом отбираем п индивидуумов из W и у каждого из них измеряем как переменные(Х, так и Уу Здесь случайными являются обе величины X и Y. Преимущество этого метода получения выборки заключается в том, что мы можем сделать статистические выводы относительно коэффициента корреляции между X и Y, в то время как при первом методе этого сделать нельзя.
Независимо от способа получения выборки, имеются два предварительных шага для определения существования и степени линейной зависимости между X и Y. Первый шаг заключается в графическом отображении точек (хъ у-,),..., (хп, уп) на плоскость XY. Такой график называется диаграммой рассеяния. Анализируя диаграмму рассеяния, мы можем эмпирически решить, допустимо ли предположение о линейной зависимости между X и Y. Вторым шагом является вычисление выборочного коэффициента корреляции
п
л S — *) (yi — у)
' Г = -Г1г^-п-W (ЗЛЛ)
S (*< - *)2 S (yi - у?
Если абсолютная величина коэффициента корреляции велика (это будет обсуждаться в разд. 3.1.4), это обоснованно указывает на сильную линейную зависимость между переменными.
В некоторых ПСП программы для анализа корреляций вычисляют корреляцию между X и Y и строят диаграмму рассеяния одновременно. Эти программы, если они допускают преобразование признаков, в частности, полезны для выявления линейной зависимости. Так, при одном прогоне такой программы исследователь может получить корреляции и диаграммы рассеяния для любой комбинации преобразований X и Y, например (X, log Y), (log X, Y), (log X, log Y), (/X, log Y) и т. д. Преобразование, для которого получается наибольшее по абсолютной величине значение коэффициента корреляции, будет тем преобразованием, которому соответствует наиболее сильная линейная зависимость. Таким образом, если, например, наибольшим по абсолютной величине является коэффициент корреляции между X и log Y, то соответствующая диаграмма рассеяния покажет наиболее ярко выраженную эмпирическую линейную зависимость. Приведем теперь три примера, которые будут анализироваться в этой главе.
Пример 3.1.1. Калибруется прибор для измерения концентрации молочной кислоты в крови. Исследователь использует п — 20 образцов (выборок) с известной концентрацией и затем вычисляет концентрацию, определенную исследуемым прибором. Пусть X
Предыдущая << 1 .. 48 49 50 51 52 53 < 54 > 55 56 57 58 59 60 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed