Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 32

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 26 27 28 29 30 31 < 32 > 33 34 35 36 37 38 .. 183 >> Следующая

строим следующую эмпирическую ФР F (х):
0, — oo<x<x(i),
F(x) = ¦ i/n, x{i)<.x<xll+i), j= 1, n—1, (2.2.10)
1, x(n)<:x<oo.
Заметим, что эта ФР имеет скачок величины 1/п в каждой точке с абсциссой х{, в то время как введенная в разд. 2.2.1 ФР имеет скачки различной величины на каждом интервале группировки. Статистикой критерия является
D = max | F (х) - F0 (х) |. (2.2.11)
x
Гипотеза Н0: F (х) = F0 (х) отвергается, если Р-значение, соответствующее D, меньше а. Р-значения для п < 100 и приближенные формулы для вычисления Р при п > 100 содержатся в табл. 4 приложения II.
Замечания 2.2.3. 1. Некоторые пакеты программ вычисляют статистику D критерия К—С и соответствующее Р-значение, например, подпрограмма K0LM0 пакета IBMSSP. В этой подпрограмме D вычисляется по формуле
D= max|F(*(0) — F0(x{i))\,
i
несколько отличной от формулы (2.2.11), а Р-значения вычисля-* ются по указанной приближенной формуле в табл. 4 приложения II. 2. Чтобы выбрать один из двух критериев, необходимо знать мощность каждого из них. Так как распределение при альтернативной гипотезе обычно неизвестно, то определить мощность точно
2.2. Анализ непрерывных переменных
79
невозможно (МаБэеу (1951), Кас е? а1. (1955)). Сравнение мощности двух критериев показало, что для некоторых альтернатив критерий К—С имеет большую мощность, чем х2- В частности, критерий К—С является более мощным, чем х2. при проверке на нормальность, когда и. и а2 оцениваются посредством х и 52.
3. В случае когда параметры оцениваются по выборке, Р-значения для критерия К—С не точны (ЫШеЬгБ (1967)).
4. Некоторые программы, например ВЛШР20, выводят на печать коэффициенты асимметрии и эксцесса, определенные в замечании 2.2.2.4 вместе с их стандартными отклонениями ее (Ьх) и ее (Ь2). В последнем случае эти статистики можно использовать для проверки двух нулевых гипотез, а именно Я0: р\ = О и Н0: р2 — 3 = 0. Асимптотически каждая из статистик г0 = = Ь/ве (Ьг) и 20 = (Ь2 — 3)/зе (Ь.2) распределена по ./V (0, 1). Р-значения можно получить из табл. 2 приложения II. Эти два критерия можно использовать совместно для проверки гипотезы о нормальности.
Пример 2.2.2 (продолжение). Для проверки нулевой гипотезы о том, что данные о сердечном индексе в примере 2.2.2 выбраны из совокупности с нормальным распределением, были использованы оба вышеупомянутых критерия согласия (х2 и К—С) при а = 0.05. Так как циог неизвестны, мы заменим их выборочными оценками х = 2.45 и^ = 1.74. Пусть X — сердечный индекс. Тогда нулевую гипотезу можно записать в виде Н0: X ~ N (2.45, 1.74), а альтернативу — в виде Нг: Х*N (2.45, 1.74). Для критерия ха используем интервалы группировки из табл. 2.2.1. Заметим, что
Таблица 2.2.1
Таблица наблюдаемых н ожидаемых частот сердечного индекса для 112 критически больных пациентов
Интервал группировки
На^люЪ. частота
[-00,0.5) [0.5, 1.0) [1.0, 1.5) [1.5, 2.0) [2.0, 2.5) [2.5, 3.0) [3.0, 3.5) [3.5, 4.0) [4.0, 4.5) [4.5, 5.0) [5.0, оо) .
1 9 23 17 13 12 10 9 9 3 6
7.85 7.38 11.20 14.67 16.58 16.46 14.00 10.42 6.61 3.81 3.02
5.98 0.36 12.43 037 0.77 1.21 ¦1.14 0.19 0.86 0.17 2.94
80
Гл. 2. Элементарные статистические выводы
ширина всех интервалов группировки, кроме первого и последнего, равна 0.5. Границы первого и последнего интервалов были выбраны так, что ожидаемая частота в каждом из них не менее рекомендованного значения 2.0. Вычисляя
2__ (7.85-I)2 (7.38-9)2 , . (3.02 - б)2
Хо 7.85 + 7.38 -Г " ' ~г з_02
получим Хо = 26.4 с v = 11 — 3 = 8 степенями свободы. Так как Р < 0.001, мы должны отвергнуть #0.
Для вычисления статистики D критерия К—С по исходным данным была использована программа из ПСП. Оказалось, что D = 0.161. Так как 95-я процентиль асимптотического распределения D равна 1.36V 112 = 0.129 < 0.161 (табл. 4, приложение II), то Р < 0.05. Поэтому мы также отвергаем Я0.
2.2.3. Проверка гипотез и доверительные интервалы для |1 и о*
В этом разделе мы обсудим стандартные критерии для проверки гипотез о среднем (д. и дисперсии а2 в популяции. Как уже указывалось в разд. 2.2.2, эти критерии основаны на предположении а_нармальности соответствующих распределений."Поэтому для обоих критериев мы предположим, что хи хп является случайной выборкой из популяции с функцией распределения N ((д., а2). Для проверки гипотезы о том, что среднее (д. равняется некоторой константе \in, т. е. Я0: и, = мы воспользуемся z-критерием, если а2 известно (или а2 неизвестно, но п велико), и . f-критерием; если а2 неизвестно (г-критерий обсуждается в разд. 1.5, приложение I). Статистикой ^-критерия служит
t0= [/п, (2.2.12)
имеющая при выполнении гипотезы Н0 ^-распределение Стьюдента с v = п — 1 степенями свободы (табл. 5, приложение II). Р-значе-ния зависят от альтернативной гипотезы и выписаны в приводимой ниже таблице (см. также изображение критических областей на графиках рис. 2.2.5)
Нулевая Альтернативная Р-значение
гипотеза гипотеза
На'- (1 = Ца, о2 неизвестно Я, : Ц > Цо Р = Pr(t(v)> t0) .
Я,: ц < Цо Р= Pr(l(v)<l0)
Предыдущая << 1 .. 26 27 28 29 30 31 < 32 > 33 34 35 36 37 38 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed