Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 44

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 38 39 40 41 42 43 < 44 > 45 46 47 48 49 50 .. 183 >> Следующая

Замечания 2.5.1. 1. Как и в дисперсионном анализе, в случае, когда в соответствии с критерием х2 отвергается нулевая гипотеза о независимости, нет никаких указаний на то, какая из альтернатив верна. Однако дальнейший анализ наблюдаемых и
114
Гл. 2. Элементарные статистические выводы
теоретических частот может помочь обнаружить некоторые из этих альтернатив.
Cochran (1954) и Maxwell (1961) обсуждают некоторые подходящие для этой цели методы.
2. Если исследователь применит несколько критериев %2 к одному и тому же множеству данных, то их совместный уровень значимости, как правило, не будет совпадать с номинальным значением а. Поэтому можно применить более сложную методику разбиения общего х2 на компоненты (Maxwell (1961, гл. 3)).
3. Как уже обсуждалось в разд. 2.1, критерий х2 является приближенным и дает хорошие результаты, если ожидаемые частоты Ftj достаточно велики. Для 2х2-таблицы с малыми Fi} положение улучшается, если применить поправку Йетса на непрерывность, т. е. добавить 1/2 к отрицательным разностям 3ftj — Ftj и вычесть 1/2 из положительных разностей.
2.6. Другие критерии независимости для таблиц сопряженности признаков
В программе BMDP1F пакета BMDP и процедуре CROSS-TABS пакета SPSS на печать выводятся не только обычная статистика критерия х2 Для таблиц сопряженности признаков, но и другие статистики. Глубокий статистический анализ включает не только проверку гипотезы о независимости, но и сравнение самих критериев для более полного понимания результатов. Более того, из дальнейшего будет ясно, что интерпретация критериев зависит от типа обрабатываемых данных. Например, критерий ранговой корреляции Кендалла применяется для данных в порядковой, интервальной и относительной шкалах, но не в номинальной, а критерии Гудмена и Крускала применяются для номинальных или порядковых категорий, если они не являются результатом измерений непрерывных случайных величин.
В настоящем разделе описываются многие из этих критериев— сначала для 2х2-таблиц, а затем для rxc-таблиц. Для рассматриваемого критерия независимости будем приводить или его выборочное распределение, или его асимптотическую стандартную ошибку (ASE). Во втором случае проверка гипотезы о равенстве нулю среднего некоторого критерия завершается использованием статистики
_ Статистика критерия ,„ . ..
2 ASE - (2.Ь.1)
Так как г имеет асимптотически нормальное распределение N (0, 1), то для получения приближенных Р-значений можно использовать таблицу 2 из приложения II,
2.6. Другие критерии независимости
115
2.6.1. 2х2-таблица сопряженности признаков
Как и в разд. 2.5, будем проводить классификацию по двум признакам (или факторам) А и В, каждый с двумя уровнями (классами) (аъ а2) и (Ьъ Ь2). Пусть — наблюдаемая частота в ячейке ц, /,-. — сумма частот в строке I, /.;- — в столбце / , а п — общий объем выборки (I, / = 1, 2). Проверяется гипотеза Я0 об отсутствии зависимости между А и В. Обсудим сначала процедуру получения точных Р-значений, а затем — альтернативы к обычному критерию %2.
I. Точный критерий Фишера. Этот критерий дает точные Р-значения, в то время как критерий %2 дает приближенные Р-значения. Предположим, что суммы по строкам Д.,/г., а также по столбцам /.1, /.2 фиксированы, так что знание только одного элемента таблицы, например /и, влечет за собой знание и всех остальных. Для вычисления вероятности получения /ц наблюдений в первой ячейке (или всей таблицы при фиксированных суммах по строкам и столбцам) используем гипергеометрическое распределение. Тогда
Рг (/и, /12, и, /22) === /11|/122!/21!1/22!2„! • (2'6-2)
Для проверки гипотезы #0 нужно вычислить вероятность Рг (/п. /12, /21, /22) для таблицы наблюдений и всех возможных таблиц, либо только с большими, либо только с меньшими значениями /и. Тогда Р-значение является суммой соответствующих вероятностей Рг (/ц, /12, /21, /22), что иллюстрируется следующим примером.
Пример 2.6.1. Для исследования связи дыхательной функции и привычки к курению в популяции сотрудников учреждения аномальные результаты легочных проб были сопоставлены с режимом курения (Агеп е1 а1. (1977а)). В одной из таких легочных проб РЕХ*^ измеряется объем в литрах выдохнутого воздуха через 1 с после начала форсированного выдоха. Результаты для случайной выборки из 42 служащих приводятся в следующей таблице.
В =
Ненор- Нормально Всего мально
А = Привычка к курению
Курящие
Некурящие
Всего
4 16
1 21
37
20
22 42
lie
Гл. 2. Элементарные статистические выводы
Для проверки гипотезы о независимости между величиной FEV! и привычкой к курению был использован точный критерий Фишера. Вероятность получить таблицу наблюдений составляет Рг (4, 16, 1, 21) = 0.1253. Ниже приводится единственная возможная таблица с большим значением чем предыдущая. Для нее Рг (5, 15, 0, 22) = 0.0182, так что Р = 0.1253 + 0.0182 = = 0.1435 и #0 не отвергается.
В =:FEVx
Нор- Всего мально
Ненормально
А = Привычка к курению
Курящие 5 15 20
Некурящие 0 22 22
Всего 5 37 42
Замечания 2.6.1. 1. В большинстве программ из ПСП точный критерий Фишера приводится лишь для выборок малого объема. Например, в программе BMDP1F критерий вычисляется, лишь если максимальная ожидаемая частота не превосходит 20. Для программы CROSS-TABS из SPSS критерий вычисляется, если объем выборки не превосходит 21.
Предыдущая << 1 .. 38 39 40 41 42 43 < 44 > 45 46 47 48 49 50 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed