Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 34

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 28 29 30 31 32 33 < 34 > 35 36 37 38 39 40 .. 183 >> Следующая

Можно показать, что ци и цх связаны соотношением \іу
= lg Рх
1.15а2,.
Так как хорошей оценкой а%у является в|
= 0.068, то за гипотезу Я0 о величине цу естественно принять Я0: Ну = ^ 3.5— 1.15-0.068 = 0.466. Так как выборочными статистиками являются у ~ 0.335 ив^ = 0.261, то I принимает значение
(0.335 — 0.466) 1^112
к-
0.261
= — 5.31.
Следовательно, Я„ снова отвергается с Р < 0.001.
Для проверки гипотезы о дисперсии целесообразно использовать преобразованную переменную У, поскольку распределение У ближе к нормальному, чем распределение X. Предыдущие эксперименты со здоровыми пациентами показали, что ау = 0.3. Проверим гипотезу о том, что пациенты в рассматриваемой выборке принадлежат популяции с той же дисперсией, т. е. Я0: о-2, = 0.09. Поскольку здесь нет логических оснований для односторонней альтернативы, примем, что Нх: а\ Ф 0.09. Значением х2 будет
111(0.261)' я. п
—Ш— = 840
с v = 111 степенями свободы. Так как Р 0.20, мы принимаем Я0.
2.3. Анализ двух непрерывных случайных величин
85
Заметим, что о| = 0.09 лежит в 95 %-ном доверительном интервале
(ШУ , 111 (°74261)2 )^ (0.058, 0.102), что также означает принятие Я0 при уровне значимости а = 0.05.
2.3. Дескриптивные программы с расслоением данных. Анализ двух непрерывных случайных величин
В настоящем разделе обсудим использование дескриптивных программ анализа данных о двух непрерывных случайных величинах. Рассмотрим сначала случай, когда две различные случайные величины Хх и Х2 определены на одной и той же популяции Ш, так что можно исследовать ковариацию и корреляцию между величинами Хх и Х2. Случайная выборка из популяции состоит из п пар наблюдений, причем каждая пара наблюдений получена путем измерений на одном и том же индивидууме выборки. Затем обсудим, каким образом дескриптивная программа печатает гистограмму и выборочные статистики для каждого Х1 и как вычисляются и печатаются оценки ковариации и корреляции в рассматриваемой популяции. Далее, если Хх и Х2 можно сравнивать, т. е. если они измеряют одинаковые или однотипные характеристики, можем сравнить средние значения величин Хг и Х2, используя парный 1-критерий.
После этого обсудим случай, когда одна и та же случайная величина X определена на двух различных популяциях №х и 417%. Эти популяции можно рассматривать как подпопуляции или слои (страты) из более широкой популяции №. В этом случае производятся две независимые случайные выборки —• по одной из каждой популяции. Опишем, как можно использовать дескриптивную программу с расслоением данных для построения гистограмм как Хх, так и Ха, а также обсудим использование выборочных статистик для проверки гипотезы о равенстве средних для Х± и Х2. Для этого нам потребуются двухвыборочный 1-критерий и Ь-крите-рий Уэлча.
2.3.1. Одна популяция. Две случайные величины
В этой ситуации у нас есть две случайные величины Хх и Х2, определенные на одной и той же популяции №'. Пусть |х< и а\ — среднее и дисперсия величины Хг, а а}1 = аи —^ковариация между Хг и X}, (,]= 1,2 (разд. 1.6, приложение I). Заметим, что
86
Гл. 2. Элементарные статистические выводы
Оц — аЬ i = 1.2. Коэффициент корреляции р(/- между Xt и X,-по определению равен
( Р'/ = -^'' 2- с2-31)
Заметим, что Рл_= ?22 = 1 и что — 1 < р12 = p2i < 1 • В разд. 3.1 будет показано, что коэффициент корреляции р12 есть мера линейной связи между Хг и Х2 — чем ближе | р121 к 1, тем больше степень линейной связи, а чем ближе р12 к 0, тем меньше степень линейной связи.
Из популяции W производим случайную выборку объема п и наблюдаем Хх и Х2 у каждого индивидуума в выборке. Резуль-Индивидуум Данные таты наблюдений обозначим хп, х1ч
и х21, х2п, так что xik есть k-e на-
1 хп, х21 блюдение случайной величины Хи
2 х12, х22 i = 1,2, k = 1, п. Результаты на-
блюдений запишем в виде таблицы. ' Обрабатывая эти данные при помощи дескриптивной программы из ПСП, по-п хх лучим гистограмму для наблюдений
1'" 2п хи> *12, • ¦¦> х1п и гистограмму для х21, лг22, xin. Кроме того, мы получим МП-оценки параметров распределения. Так, для i, / = 1,2 МП-оценками параметров Мч, о с/ и pi/ служат соответственно
1 п xi. = — ? Xik,
ft- 1
г„="-^. (2.3.2)
(Точка вместо второго индекса у х{. означает, что по этому индексу произведено осреднение.)
Выборочные дисперсии, коэффициенты ковариации и корреляции обычно представляются в матричной форме и печатаются в виде
[вц = 512
1 г12
корреляционная матрица i .
2.3. Анализ двух непрерывных случайных величин
87
Так как обе матрицы симметричны, иногда печатаются только их диагональные и наддиагональные элементы.
Анализу ковариационных матриц посвящены разд. 5.6 и 5.7, а корреляционных — разд. 3.1. Напомним теперь читателю, что каждую гистограмму можно использовать для а) локализации грубых ошибок; Ь) локализации выбросов; с) построения эмпирических распределений; с!) вычисления выборочных статистик; е) эмпирического преобразования данных к нормальному распределению и I) проверки гипотез относительно и а}, I = 1,2, как это было описано выше. Далее, если Хги Х2 сравнимы, т. е. имеют одинаковые размерности, то можно проверить гипотезу относительно и.! — ц2. Прежде чем сделать это, рассмотрим следующий пример.
Предыдущая << 1 .. 28 29 30 31 32 33 < 34 > 35 36 37 38 39 40 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed