booksshare.net -> Добавить материал -> Биология -> Лакин Г.Ф. -> "Биометрия " -> 132

Биометрия - Лакин Г.Ф.

Лакин Г.Ф. Биометрия — Высшая школа, 1990. — 350 c.
Скачать (прямая ссылка): biometriya1990.djvu

Предыдущая << 1 .. 126 127 128 129 130 131 < 132 > 133 134 135 136 137 138 .. 155 >> Следующая

закономерность. Обычно эту задачу решают следующим образом. Эмпирический
ряд регрессии или динамики, для которого подыскивают наилучшее
корреляционное уравнение, изображают в виде точечного графика в системе
прямоугольных координат. Если эмпирические точки располагаются на одной
прямой или могут быть аппроксимированы прямой линией, зависимость между
переменными величинами описывают уравнением линейной регрессии. Труднее
выбрать наилучшее уравнение регрессии при наличии нелинейной связи между
переменными величинами. В таких случаях подходящее уравнение подбирают на
основании сравнения эмпирического графика с известными образцами кривых.
Немаловажное значение при выборе уравнения регрессии имеют личный опыт и
профессиональные знания исследователя. Иногда форма связи между
переменными Y и X сама по себе подсказывает выбор наилучшего уравнения
регрессии. Примером может служить лактационная кривая или кривая, от-
303
ражающая закономерность возрастания численного состава популяции в
замкнутой среде обитания и т. п. явления.
Графический анализ не гарантирует от возможных ошибок, особенно в тех
случаях, когда главное направление регрессии или динамики (их тренд)
сильно затушевывается колебаниями членов ряда. Поэтому наряду с
графическим анализом применяют и аналитические способы проверки
правильности выбора корреляционных уравнений.
Одним из них является применение принципов дисперсионного анализа.
Неадекватность линии регрессии, найденной теоретическим способом по
отношению к эмпирической линии, может быть описана суммой квадратов
отклонений ^=2 {УХ1~У*1) '
Случайная вариация наблюдений уц по отношению к условным средним уХ[,
найденным эмпирически, определит девиату
a f х _
Dl = '^'^(ytj~yXl)2. Здесь для различения эмпирических и 1-1
теоретических условных средних использованы обозначения: уХ{ > для первой
и yXi для второй. По каждой из девиат может быть найдена соответствующая
дисперсия. Так, дисперсию неадекватности регрессионной модели находят по
формуле
к а - т *
где а - число классовых интервалов, для которых находили эмпирические
средние уХ[\ т - число параметров, определяемых в регрессионной модели.
Это количество для прямолинейной регрессии равно двум, для квадратической
параболы - трем и т. д. Остаточная дисперсия может быть получена по
формуле

1-D* е п - а е
Сравнение двух дисперсий осуществляют по /•'-критерию Фишера (F=sR2Jse2)
с числами степеней свободы ki - a-т и ki=n-а.
Характерно, что для случая проверки неадекватности прямолинейной
регрессии величина f-критерия сводится к выражению
jl 2 2
р Vх ГУХ п -а
l-h2 а - 2 1 ух
которое полностью совпадает с уже известным критерием прямолинейности
корреляционных связей.
Однако при работе с непрямолинейными уравнениями регрессии эта
формула оказывается неприменимой, и следует поль-
304
зоваться непосредственным определением девиат неадекватности и остаточной
случайной изменчивости. Это осуществляется следующим образом.
Пусть по признаку X существует группировка (вариационный ряд),
включающая а классов, в каждом из которых содержится fx наблюдений. Пусть
теперь в каждом классе признака X по
значениям признака У определена условная средняя уХ{ = 1 1x1
=------V ytj. Здесь суммирование производят по всему коли-
f xi j=i
честву наблюдений, попадающих в i-й класс. Совокупность условных средних
уХ{ в зависимости от значений Xi (центральных значений классового
интервала) составит эмпирическую линию регрессии У по X. Пусть теперь
найдена теоретическая линия регрессии yx=f(х) и определены теоретические
значения условных средних для каждого интервала по признаку X.
В соответствии с принципами дисперсионного анализа необходимо найти
две девиаты: Dr2- неадекватности регрессии и De2 - остаточную. Для
проведения вычислений удобнее воспользоваться простыми формулами
t-i\j-i 1 xi {y*i~~y*t) ' t-l
Согласно одной из них, для каждого интервала находится разность двух
значений условных средних уХ( и yXl, , которую возводят в квадрат и
домножают на число наблюдений fXl. Суммирование производят по всем а
классовым интервалам. Согласно второй формуле, для каждого класса
вычисляют сумму квадратов значений признака у У\^ " свойственных тем
наблюдениям, которые оказались в этом классе. Затем для каждого интервала
находят величину^? у]]~ fxftxf после чего все эти а
}
значений суммируют. Делением на числа степеней свободы &я= = а-т и ke=n-а
получают искомые дисперсии, сопоставляемые в рамках /^-критерия Фишера.
Если превысит табличное значение Fst, найденное для kR и ke, а также
выбранного уровня значимости а, то необходимо будет признать, что
предположение об адекватности построенной теоретической регрессии следует

Предыдущая << 1 .. 126 127 128 129 130 131 < 132 > 133 134 135 136 137 138 .. 155 >> Следующая