Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 25

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 19 20 21 22 23 24 < 25 > 26 27 28 29 30 31 .. 183 >> Следующая

1.7.4. Проверка по парам переменных. Программы построения таблиц сопряженности признаков и диаграмм рассеяния
Проверка по отдельным переменным не позволяет выявить все ошибки в данных. Поэтому желательно установить некоторые соотношения между парами переменных с тем, чтобы обнаружить случаи, в которых эти соотношения не выполняются. С этой точки зрения программы построения таблиц сопряженности признаков (или программы перекрестного табулирования) могут оказаться полезными для дискретных переменных, измеренных в номинальной или порядковой шкалах, а также для непрерывных, но сгруппированных переменных.
Программы построения таблиц сопряженности признаков вычисляют и выводят двумерную таблицу, называемую двухфактор-ной таблицей сопряженности признаков. Она описывает ситуацию, когда каждый индивидуум (или экспериментальная единица) в популяции № классифицируется двумя различными факторами (или критериями) А я В. Мы будем считать, что фактор А имеет г 5; 2 классов (или уровней), а фактор В имеет с 5= 2 классов (или уровней). Рассматривая г классов фактора А как столбцы, а с классов фактора В как строки, получим двухфакторную таблицу сопряженности признаков следующего вида.
1) То есть у = Ф~* ^(*)). — Прим. перев.
1,7. Проверка данных
61
А 1 2 3 с Итоги по строкам
1 /и /.2 Л У - /,с Л.
2 Л. /2 2 /г.
3 л. /32 /э, - Ьс А.
г /,з /гс Гг.
Итоги по
столбцом /.2 /з /с п
Она называется также гХс-таблицей сопряженности (или просто гхс-таблицей). Пересечение строки и столбца называется ячейкой. Для выборки объема п из популяции ^ число индивидуумов /у, относящихся к г'-му уровню фактора Л и /-му уровню фактора В, помещается в ячейку г'/, г = 1, г, / = 1, с. Число {и называется наблюдаемой частотой ячейки г/.
Входящие в ПСП программы построения гХс-таблиц просматривают всю выборку из п наблюдений и определяют наблюдаемые частоты для всех ячеек. Затем они подсчитывают суммы для всех строк и /7 для всех столбцов, г = 1, г, ] = 1, с. Величины Д. и /./ называются соответственно итогами по
г с
строкам и столбцам. Заметим, что 2 /<• = I] — п, т. е. равно
*=1 /=1
объему выборки. Построенная таблица затем выдается на печать.
После получения таблицы можно приступить к поиску грубых ошибок в данных, ненайденных при проверке по отдельным переменным. Кроме того, можно проверить гипотезы о связи между факторами Л и В. Обсуждение этой возможности мы отложим до разд. 2.5.
Пример 1.7.1 (продолжение). После использования соответствующей программы была построена таблица сопряженности для факторов Л = пол (1 — мужчины, 2 — женщины) и В = прием противозачаточных средств (1 — да, 2 — нет). Ниже приводится полученная 2х2-таблица.
В = Прием противозачаточных средств 1 = Да 2 = Нет
А = Пол
1 = Мужск.
2 = Женек.
5 295
32 484
37
779
300
516
816
62
Гл. 1. Введение в анализ данных
Пять мужчин, принимавших противозачаточные пилюли, очевидно демонстрируют пример грубых ошибок, которые невозможно обнаружить при анализе распределений частот переменных «пол» и «прием противозачаточных средств» в отдельности.
Полезным средством проверки для непрерывных переменных X и К, не разбитых на дискретные категории, является диаграмма рассеяния, т. е. двумерная диаграмма, изображающая нары значений (л'ь у^, (х2, у?), (хп, уп). Помимо пользы для определения линейной зависимости между X и К (см. разд. 3.1) диаграмма рассеяния полезна для определения грубых ошибок и выбросов, не вылавливаемых одномерными гистограммами.
ВО.500 * * 80.500
79 500 - , t 79. 500
7Н 500 - 11 - 78.500
7 7 500 - 1 - 7 7.500
76 500 • 1 1 » 76.500
75. 50<) - 1 Г 1 1 7Ъ 500
7-1 50I. ¦ 1 2ЛП1 1 31 21 1 2 - 74.500
73 MJH - 1 2 31 1 1 1 - 75.500
12 500 - 111 23 2151 53141! 51 1 1 1 1 72 500
71 500 • 1 12 1111211221213 И 22 1U1 1 1 * 71.500
71 500 ¦ 1 31 622 J163321 2 2 1 - 70.500
69.500 1 2243.23153 2 3372421 2 - e9.500
66.50^ - 5 2113 574725412 33131 111 1 - 68.500
67,500 - 1 1 21462016525375 3133 11 - 67.500
66.500 * lJ23J69J'e4?6 41242411 2 111111 1 «66.500
65.500 - 1 116.129619 773314212 1 1 3 - 65.500
64 500 - 1 356437936455321331 111 1 2 11 1 - 64.500
63 500 - 13 2 524524614 31 2 23 1 1111 - 63.500
62.500 - 1 161165*67429 11 1H f*. - 62.500
Предыдущая << 1 .. 19 20 21 22 23 24 < 25 > 26 27 28 29 30 31 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed