Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 31

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 25 26 27 28 29 30 < 31 > 32 33 34 35 36 37 .. 183 >> Следующая

Если вычисление некоторых из этих величин не предусмотрено в программе обработки гистограмм, то их можно оценить с помощью таблицы частот, гистограммы или эмпирической ФР. Мы уже видели, как оценить моду с помощью гистограммы, а медиану и другие процентили —¦ с помощью эмпирической ФР. Приближенное значение выборочного среднего вычисляется по гистограмме или таблице частот по формуле
х = -~Ъ^1, (2.2.2)
" 1=1
где С; = (с, + си1)/2 есть середина г-го интервала, I = 1, к, а приближенное значение выборочной дисперсии — по формуле
76
Гл. 2. Элементарные статистические выводы
Вообще приближенным значением }-го начального момента служит
(2.2.4)
а j-го центрального момента —
m, = -L^ft(ct-xy: (2.2.5)
В следующем замечании обсуждаются некоторые дополнительные величины, полученные из дескриптивных программ.
Замечания 2.2.2. 1. Величина six называется коэффициентом вариации и служит для измерения стандартного отклонения в долях среднего значения.
2. Преобразование z = (х — x)ls преобразует случайную величину X в безразмерную стандартизованную случайную величину Z. Гистограммы нескольких стандартизованных случайных величин можно сравнивать, если у них у всех одинаковые интервалы группировки. Построение гистограммы Z может потребовать двух циклов обработки массивов данных: во время первого вычисляются х и s, а во время второго X преобразуется в Z и строится гистограмма Z.
3. Преобразование переменных позволяет получить и другие полезные статистики, которые можно вычислить как выборочные средние от преобразованных наблюдаемых значений. В следующей таблице приводятся эти преобразования и названия соответствующих выборочных средних.
Преобразо- „ ,
вание Выборочное среднее
Мх Среднее гармоническое log х log среднего геометрического
х1 i-н начальный момент (х—х){ i-й центральный момент | х—х | Среднее абсолютное отклонение_
4. Двумя другими мерами.для описания распределений служат коэффициент асимметрии
Pi=FV(a2)3/2
и коэффициент эксцесса
где Hi есть i-й центральный момент в популяции. Если плотность распределения симметрична, то Pi = 0. Если плотность имеет
2.2. Анализ непрерывных переменных
77
длинный «правый хвост», то рх > 0, а если длинный «левый хвост», то Рх < 0. Для нормального распределения р2 равно 3. Если же распределение сконцентрировано вокруг среднего больше, чем нормальное, то Р2 < 3, а если меньше — то ра > 3.
5. Пробит-график, описанный в разд. 1.7.3, может быть получен из- эмпирической ФР. Как там указывалось, аргумент эмпирической ФР наносится на горизонтальную ось, а нормальной — на вертикальную. Значения аргумента нормального распределения получаются путем вычисления Ф-1 (/Уп) = гй I — 1, к + 1, где Ф-1 — обратная функция для стандартной нормальной ФР, так что Ф (гг) = Т^/п •— накопленные доли частот в точках с{, I = 1, к + 1 (см. пример на рис. 1.7.5).
2.2.2. Согласие
Как указывалось в предыдущем разделе, гистограмму или эмпирическую ФР можно использовать для оценки распределения случайной величины X. В этом разделе мы изучим две статистики, которые можно использовать для проверки гипотезы о том, что наблюдения распределены в соответствии с некоторой теоретической ФР 1^0 (х). Так как при стандартной проверке гипотез относительно (д. и а2 предполагается, что X имеет нормальное распределение, то мы рассмотрим именно этот случай.
1. Критерий согласия %2. Допустим, что мы имеем случайную выборку объема п и выбрали к интервалов группировки 1съ с2), 1с2, с3), [ск, с&+1), где сг = — оо и см = +оо. Пусть Д- — наблюдаемая частота в интервале [сг, с1+1), а
^ = п Рг (сг < х < си1) = п(с(+1) - ^0 (с,)] (2.2.6)
— ожидаемая частота в этом интервале, I = 1, к. Тогда если верна гипотеза Н0: (х) = Р0 (х), то статистику
Хо= Е(^-/02/^- (2.2.7)
1=1
при большом п можно аппроксимировать с помощью распределения х2 с
V ? - 1 -т (2.2.8)
степенями свободы. Здесь величина т равна числу независимых параметров гипотетического распределения, которые оцениваются по выборке. Р-значением является площадь области под функцией плотности распределения %2 (V) справа от точки %о (табл. 3, приложение II). Если Р < а, то мы отвергаем Н0 и принимаем гипотезу Нг: ^ (х) Ф F0 (х).
78
Гл. 2. Элементарные статистические выводы
Если ФР гипотетического распределения является N (ц, аа), то Ft = п [Ф - Ф (^)] , (2.2.9)
где Ф (х) — стандартная нормальная ФР. Так как (д. и а обычно неизвестны, мы получаем их оценки х и s по рассматриваемой выборке и подставляем их в (2.2.9). Следовательно, в (2.2.8) m = 2 н v = А — 3. Точность приближения %а возрастает с ростом Ft. Следовательно, интервалы группировки надо выбирать так, чтобы F{ были «не очень малы», т. е. чтобы при любом i = 1, k выполнялось эмпирическое условие Fj ^ 5. Опыт показывает, что аппроксимация может оставаться удовлетворительной даже при F{ ^ 2 для некоторых i я Ft ^ 5 — для остальных L
2. Критерий Колмогорова—Смирнова (К—С). Пусть имеется п наблюдений хг, хп. Упорядочим их по возрастанию, обозначим г'-е по величине значение выборки через x{ly, i ¦= 1, п, и по-
Предыдущая << 1 .. 25 26 27 28 29 30 < 31 > 32 33 34 35 36 37 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed