Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 43

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 37 38 39 40 41 42 < 43 > 44 45 46 47 48 49 .. 183 >> Следующая

В = Возрастная группа 1 2 3
1 = Муж.
Л = Пол
2 = Жен.
Здесь гипотезой об однородности будет Я0: рп = рг1, р1а = — Р-221 Р13 = Раз> а гипотезой о независимости — Я0: возрастная группа и пол для данной популяции независимы.
2.5. Анализ таблиц сопряженности признаков
111
2.5.2. Гипотезы о независимости
В этом случае исследуется одна популяция №, причем каждый ее индивидуум классифицируется в соответствии с двумя факторами: А и В. Здесь нулевая гипотеза формулируется только в терминах независимости А и В, а альтернативная гипотеза состоит в том, что А и В зависимы.
В рассматриваемом случае как А, так и В могут измеряться в шкале наименований или порядковой шкале. В самом общем случае имеются 2 непрерывные случайные величины X и У, причем каждая из них преобразуется в порядковую шкалу. Приведем теперь соответствующие примеры.
Пример 2.5.5 (г = 2, с = 3). Пусть индивидуумы из некоторой популяции № классифицируются по наличию или отсутствию цианоза (фактор А) и по их реакции на конкретное лечение (фактор В). 2хЗ-таблица сопряженности признаков имеет вид
В — Реакция
1 = Улучшение
2 = Без изменений
3 = Ухудшение
Цианоз
1 = Есть 2= Нет
Проверяется гипотеза #„: реакция не зависит от цианоза.
Пример 2.5.6 (г = 3, с = 4). В этом примере популяцию составляют пациенты с некоторым заболеванием, прошедшие новое лечение. Для каждого пациента случайная величина означает его возраст в годах (фактор Л), а случайная величина У — число дней с температурой (фактор В). Диапазоны изменения этих величин делятся соответственно на 3 и 4 класса, так что ЗХ4-таблица сопряженности признаков принимает вид
В — Число дней с температурой 1—4 5—6 7—8 9—12
до 30
А = Возраст в годах 30—45
более 45
112
Гл. 2. Элементарные статистические выводы
Проверяется гипотеза Я0: число дней с температурой не зависит от возраста пациента.
В примере 2.5.6 каждая из двух непрерывных случайных величин X и У разбивается на классы, причем программа перекрестного табулирования автоматически определяет классы для каждой из этих величин. Это делается аналогично тому, как с помощью гистограммной программы определяются классы в одномерном случае.
Таблицу сопряженности признаков для двух случайных величин X и У можно использовать для оценки совместного распределения этих двух величин. Поэтому частотная таблица классификации по двум признакам обобщает понятие гистограммы. Далее, критерии независимости признаков А и В является и критерием независимости случайных величин X и У. Если они обладают двумерным нормальным распределением, то более желательно вычислить выборочный коэффициент корреляции между X и У и уже с его помощью проверить независимость (см. разд. 3.1).
2.5.3. Критерий у? для таблицы сопряженности признаков
Для проверки как гипотезы об однородности, так и гипотезы о независимости мы используем одну и ту же процедуру, состоящую в вычислении ожидаемой частоты Fг•^• в ячейке Ц по формуле
^/-¦^(/•/). *=»1, ...,г, / = 1, ...,с. (2.5.1)
Затем вычисляется значение %о статистики %2:
«=1 /=1
Если верна гипотеза Я0, то значение %о имеет приблизительно ^-распределение с V = (г — 1) (с — 1) степенями свободы, а Р-значение равно площади под кривой плотности %а (V) справа от точки Хо (табл. 3, приложение II). Мы отвергаем гипотезу Я0, если Р меньше заранее выбранного уровня значимости а.
Пример 2.5.7. Пусть популяция № критически больных пациентов разделяется на две подпопуляции в соответствии с тем, находятся ли они в состоянии шока. Выборка из 112 критически больных пациентов классифицировалась в соответствии с исходом и наличием или отсутствием шока. Данные приводятся в следующей таблице, где величины вне скобок —наблюдаемые частоты а в скобках — ожидаемые частоты Fг¦^.
2.5. Анализ таблиц сопряженности признаков
113
Исход
Шок Выжили Умерли Суммы по строкам
Есть 40 (49.5) 37 (27.5) 77
Нет 32 (22.5) 3(12.5) 35
Суммы по столбцам 72 40 112
16.34, V = 1
Например, 40 пациентов были в шоке и выжили, а 37 пациентов были в шоке и не выжили. Гипотезы можно сформулировать как #„: исход не зависит от наличия шока, или как Н0: доля выживших пациентов с шоком равна доле выживших без шока. Значение статистики х2 равно Хо = 16.34 с V = (2 — 1) (2 — 1) = = 1 степенями свободы. Поскольку Р-значение меньше 0.001, мы отвергаем гипотезу Я0, заключая, что вероятность смерти пациентов с шоком значимо превосходит вероятность смерти при его отсутствии.
Если исследователь хочет сравнить выживаемость при различных типах шока, он должен разделить выборку из пациентов в шоке по пяти типам шока, что дает следующую 5х2-таблицу:
Исход
Тип шока Выжили Умерли Суммы по строкам
Гиповолемическин Кардиогенный Неврогеннын Септический Эндокринный 7 (7.79) 11 (11.43) 10 (8.31) 9 (8.31) 3 (4.16) 8 (7.21) 11 (10.57) 6 (7.69) 7 (7.69) 5 (3.84) 15 22 16 16 8
Суммы по столбцам 40 37 77
1.71, v = 4
Здесь проверяется гипотеза Н0: доля выживших для всех типов шока одинакова. Значение статистики %2 равно %о = 1.71 с V = = (5 — 1) (2 — 1) = 4 степенями свободы. Оно незначимо и не дает доказательств зависимости выживаемости от типа шока.
Предыдущая << 1 .. 37 38 39 40 41 42 < 43 > 44 45 46 47 48 49 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed