Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 45

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 39 40 41 42 43 44 < 45 > 46 47 48 49 50 51 .. 183 >> Следующая

2. Выше было определено Р-значение для одностороннего критерия. Некоторые программы (например, BMDP1F) вычисляют и печатают Р-значение и для двусторонних критериев.
II. х2 и поправка на непрерывность. Для 2х2-таблицы обычная статистика %2 может быть записана в виде, эквивалентном (2.5.2):
.2 (/11/22 — /21/12)2 П
f.lf-7fl.fi. '
(2.6.3)
Это значение можно улучшить, внося поправку в числитель на аппроксимацию дискретного полиномиального распределения непрерывным распределением %2. Вводя поправку Йетса на непрерывность, получим статистику
[1/11/22-/21/12!—j-nj п /.1/.2/1./2.
(2.6.4)
которая при больших п распределена приблизительно как %2 с 1 степенью свободы. Cochran (1954) рекомендует вносить поправку на непрерывность при п <: 40, а если все ожидаемые частоты более 5, то при п <: 20.
2.6. Другие критерии независимости
117
Использование (2.6.4) критиковали Crizzle (1967) и др. за то, что оно приводит к худшему, чем при использовании (2.6.3), Р-значению. В серии статей в Journal of American Statistical Association в 1974 г. эта критика была переосмыслена. Наиболее важное предложение при этом сделал Mantel (1974). Он напомнил исследователям, что статистика критерия х2 является двусторонней, и внес следующее предложение. Для одностороннего критерия пользователь должен брать половину Р-значения, полученного с помощью (2.6.4). Для двустороннего критерия х2 пользователь должен: а) вычислить Р-значение обычного двустороннего скорректированного критерия х2 Для заданной таблицы; Ь) вычислить Р-значение для двустороннего скорректированного х2 по таблице с максимально измененным значением /ц, дающим большее значение х2; с) взять среднее из двух полученных Р-значений. Как показал Мантель, использование этих правил дает превосходное совпадение Р-значения, полученного с помощью (2.6.4), и точного критерия Фишера.
Пример 2.6.1 (продолжение). Для данных этого примера обычный критерий х2 дает Хо = 42 [4 (21) — 16 (1) ]7 [5 (37) (20) (22) ] = = 2.39, Р = 0.12; а скорректированный — соответственно хо = = 42 [|4 (21) — 16 (2) I — 21 Р/[5 (37) (20) (22)] = 1.13, Р = 0.28.
Использование правила Мантеля дает Р = 0.28/2 = 0.14, что с точностью до двух десятичных знаков совпадает с точным Р-зна-чением по Фишеру, полученным выше (Р = 0.1435).
Для двустороннего критерия изменим в таблице значение /ц с 4 на 0. Так как для измененной таблицы Хо = 3.22, Р = 0.06, то, осредняя Р для двух таблиц, получим (0.28 + 0.06)/2 = 0.17, что совпадает с точным двусторонним Р-значением, вычисленным с помощью критерия Фишера (BMDP1F дает Р = 0.1745).
III. Меры связанности, основанные на статистике х2. Хотя критерий х2 и обнаруживает значимость связанности между признаками А и В, но он не дает информации о степени этой связанности.
Мерой связанности, позволяющей сравнивать таблицы для различных значений п, служит коэффициент Ф, представляющий собой статистику
Ф = К1х27'0. (2-6.5)
где значение х2 не скорректировано, т. е. вычисляется по формуле (2.6.3).
Коэффициент Ф учитывает тот факт, что значения х2 прямо пропорциональны п. Его можно рассматривать как меру корреляции между А и В, близкую к 0 при слабой связанности
116
Гл. 2. Элементарные статистические выводы
и близкую к 1 при сильной. Ф используется в анализе табличных элементов l) (Novick, Jackson (1974)) и в дихотомическом факторном анализе (Harman (1967)). Уровень значимости критерия Е (Ф) = 0 тот же, что и для критерия независимости %2.
Две другие меры связанности являются функциями разности D между наблюдаемой и ожидаемой частотами, гдеО == /и — fi.fJn-Их статистиками являются коэффициенты связанности Юла Q и Y, равные соответственно 2)
г\ _ (/11/22 — /12/21)__nD /О r «я\
V ~~ (/и/и + /u/я) ~ (/ii/м + /1Л1) ' К^.ол)
Y = W^111*** ~ ^hihi) (2 6 6в)
Заметим, что Q = 2Y/(l + Y)'1. Эти статистики равны 1) 0, если А и В независимы; 2) 1, если Л я В полностью связаны 8); 3) —1, если А я В полностью отрицательно связаны *). Соответствующие асимптотические стандартные ошибки (ASE — Asymptotic Standard Errors) имеют вид
ASE (Q) = -J- (1 - Q2) (+- + y- + -г- + "f-)1/2 >
1 \ tu /12 /21 /22 / (2 6 7)
ASE
v ; 4 v ; V /и /12 /21 /22 /
Как указывалось во введении к этому разделу, критерии значимости даются формулой (2.6.1), а Р-значение вычисляется по табл. 2, приложение II.
Очень полезную меру связанности дает отношение перекрестных произведений (называемое еще отношением шансов)
о = /11/22//12/01, (2.6 .8)
для которого
Важность этого критерия состоит в том, что он служит мерой относительного риска входного признака А и выходного признака В. Отношение шансов происходит из логистической модели,
1) В оригинале «item analysis*. — Прим. перев.
2) Коэффициент У называют также коэффициентом коллигации. — Прим. перев.
8) То есть /12 /21 = 0. — Прим. перев.
4) То есть /и /22 = 0 (полная отрицательная связанность). — Прим. перев.
2.6. Другие критерии независимости
119
широко применяемой в эпидемиологических исследованиях (подробное обсуждение см. Р1е185 (1973)). Интерпретацию отношения шансов дает
Предыдущая << 1 .. 39 40 41 42 43 44 < 45 > 46 47 48 49 50 51 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed