Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 47

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 41 42 43 44 45 46 < 47 > 48 49 50 51 52 53 .. 183 >> Следующая

Гл. 2. Элементарные статистические ВЫВОДУ
в случае г = с. Для ее вычисления нужно найти величину Р, равную сумме произведений каждой частоты на сумму всех частот, расположенных в таблице ниже ее и правее, а также Q, равную сумме произведений каждой частоты на сумму всех частот, расположенных в таблице ниже ее и левее:
р= ? S/ЛЕ Е/.Л,
i-i/-1 v*>*/>/ ) (2614)
Q = Е Е (? Е hi).
1=1/=1 \k>il<i I
Полагая S = Р — Q, вычислим
ть = 5|{[4-»(»-1)-7'1] [±-п(п -1)-Т.2]}1/2, (2.6.15)
г с
где 7\ = -j- 2 Л- (/<• — О. Г2 = 4" 2 f'1 — 1)- Асимптотическая стандартная ошибка равна '
ASE (ть) = Ц4п+ 10)/(9(«а - «))]i/2. (2.6.16)
Если г Ф с, можно использовать меру хс Стьюарта
те = 2mS/(n2 (т — 1)), (2.6.17)
где S, как и прежде, равно Р — Q, а m = min (г, с). Далее,
ASE (т0) = пЧт\т_{) [»а ? ? !и (Л/ - А/)2 - 4«S2]1/2, (2.6.18)
где
А, = Е Е hi + Е Е /«, в«/ = Е Е fw + Е Е f«. (2.6.19)
k>ll>j k<l К/ k>il<i k<il>i
Третьей мерой связанности является коэффициент ранговой корреляции Спирмана rs, определяемый как
12 ? Е/l/ ГЕ/*. + (/*./2)-(«^)1ГЕ /./ + (/.,/2)-(»/2)1 Т » / U<f_J U</_J_
(2.6.20)
При этом
ASE(r.) = ((l -rl)J(n~2))l/2. (2.6.21)
Все три меры изменяются в диапазоне от —1 до +1.
2.6. Другие критерии независимости
123
Пример 2.6.3. При изучении влияния курения в примере 2.6.1 интересно исследовать степень связанности между РЕУ, и АЫ2. Области изменения по каждому из этих признаков были разделены на 4 категории: 1 — низкая, 2 — ниже средней, 3 — выше средней, 4 — высокая. Каждый индивидуум выборки был отнесен к упорядоченной паре категорий в соответствии с его значениями РЕУ, и АЫ2, что дало следующую таблицу:
В = АЫ2
1 2 3 4
1 55 8 6 2 71
А = РЕУ, 2 8 33 10 2 53
3 5 10 39 6 60
4 3 2 7 22 34
71 53 62 32 218
Так как %а = 218.8 с 9 степенями свободы, то Р < 0.001 и гипотезу об отсутствии связанности следует отвергнуть. Применяя к приведенным данным три описанные выше меры связанности для упорядоченной таблицы сопряженности признаков, получим следующие результаты:
Мера Значение + АВЕ г Р-значенис
Ч " 0.641 ± 0.046 13.9 < 0.001
0.626 ± 0.046 13.6 < 0.001
г, 0.692 + 0.049 14.1 < 0.001
Приведем для иллюстрации детали вычисления хь. Р = 55 (33 + 10 + 2 + 10 + 39 + 6 + 2 + 7 + 22) + 8 (10+ + 2 + 39 + 6 + 7 + 22) + 6 (2 + 6 + 22) + 8 (10 + + 39 + 6 + 2 + 7 + 22) + 33 (39 + 6 + 7 + 22) + 10 (6 + + 22) + 5 (2 + 7 + 22) + 10 (7 + 22) + 39 (22) = 12 786, <Э = 8(8 + 5 + 3) + 6(8 + 33+5 + 10+ 3+2) + , + 2 (8 + 33 + 10 + 5 + 10 + 39 + 3 + 2 + 7) + 33 (5 + 3) + + 10 (5 + 10 + 3 + 2) + 2 (5 + 10 + 39 + 3 + 2 + +7) + 10 (3) + 39 (3 + 2) + 6 (3 + 2 + 7) = 1621.
124
Гл. 2. Элементарные статистические выводы
Поэтому 5 = 12 786 — 1621 = 11 165,
7\ = -L [71 (70) + 53 (52) + 60 (59) + 34 (33)] = 6194,
Т2 = -у- [71 (70) + 53 (52) + 62 (61) + 32 (31)] = 6250,
т„ =-1+М-ш = 0.641,
D [(23 653 - 6194)(23 653 - 6250)]1/2
ASE (ть) = [(4 (218) 4-10)/(9 ((218)2 - 218))]1/2 = 0.046.
Хотя т0 Стьюарта и не является подходящей мерой для рассматриваемой квадратной таблицы, все же вычислим т0 и ASE (тс):
тс = 2$$™) = 0.626, ASE (т0) = 0.046.
2.6.4. Меры связанности Гудмена—Крускала
В серии из четырех статей Гудмена—Крускала (Goodman, Kruskal (1954, 1959, 1963, 1972)) приводятся другие меры связанности для rXc-таблиц сопряженности признаков. Основная идея их работы состоит в том, что мера связанности должна исходить из контекста без обязательной ориентации на традиционный %2. Такие меры не универсальны и рассчитаны на применения в конкретных условиях.
В табл. 2.6.2 перечислены меры, рассматриваемые в этом разделе. Во всех случаях предполагается, что каждый признак (А
Таблица 2.6.2
Меры Гудмена—Крускала
Упорядо- Симме- „
ченность трия мера
Нет Нет
Нет Есть
Есть Нет
Есть Есть
Х-асимметричная
А,*-аснмметрнчная
т-асимметричная
Х-снмметричная
D Сомера
Гамма
или В) является дискретным. Это предположение исключает, например, возможность рассмотрения возраста в качестве признака, но позволяет рассматривать в качестве признака пол, метод лечения, выживаемость, экономическое положение и т. д. В тех случаях, когда один или оба признака по существу непрерывны, следует использовать меры связанности, основанные на коэффициенте корреляции (см. гл. 3).
2.6. Другие критерии независимости
125
Принципом построения мер в табл. 2.6.2 является способ формирования классов или уровней, поскольку мера связанности зависит от него. Поэтому нельзя говорить о связанности между Л и В без детального определения класса.
Рассматриваемые в этом разделе меры связанности зависят от наличия симметрии между факторами Л и Б, а также упорядоченности между классами одного признака. Например, такой признак, как пол, не имеет порядка, а социально-экономическое положение имеет. Симметрия зависит от того, можно ли один признак предсказать с помощью другого. Если любой из признаков может оцениваться первым либо они могут оцениваться одновременно, то признаки симметричны. Если же классификация А должна предшествовать В (или наоборот), то признаки асимметричны. Например, в планируемом или длительном обследовании наблюдение А предшествует наблюдению В, в то время как при ретроспективном обследовании наблюдение В предшествует наблюдению А. В обоих случаях таблицы сопряженности признаков являются асимметричными.
Предыдущая << 1 .. 41 42 43 44 45 46 < 47 > 48 49 50 51 52 53 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed