Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 35

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 29 30 31 32 33 34 < 35 > 36 37 38 39 40 41 .. 183 >> Следующая

Пример 2.3.1. В этом примере популяция \Р состоит из критически больных пациентов с циркуляторным шоком. Была проведена выборка объема п = 108 пациентов и у каждого из них измерялось Х% — венозное рН и Х2 — артериальное рН. Дескриптивная программа строит гистограммы для Хг и для Х2, вычисляет выборочные статистики х1 — 7.373 и х2 = 7.413, = 0.1253 и ь1 = 0.1184, 512 = 0.1101. Ковариационная и корреляционная матрицы соответственно имеют вид
0.1253 -0.1101 0.1101 0.1184
1.0000 0.9039 0.9039 1.0000
В соответствии с теорией, здесь 812 = 821, Г12 = Г21, = в*, &22 = == я^. Можно проверить также, что г12 = в^/ад. Большое значение г12 = 0.9039 свидетельствует о наличии сильной линейной зависимости между Х1 и Х2, что и следовало ожидать. Дальнейшие пояснения к этому примеру приводятся в гл. 3.
В медицине известно, -что для здоровых людей среднее венозное рН меньше, чем артериальное. Поэтому целесообразно проверить эту гипотезу для популяции больных пациентов.
Вообще, если Хх и Х2 — сравнимые измерения для одного и того же индивидуума, то гипотеза Я0: (хх —- |х2 = б, где б — постоянная, может быть проверена с помощью парного ^критерия, называемого также Ь-критерием для связанных выборок. Статистикой критерия служит
где
88
Гл. 2. Элементарные статистические выводы
При выполнении гипотезы #0 статистика ^0 имеет ^-распределение Стьюдента с V == п — 1 степенями свободы. Р-значения зависят от альтернативной гипотезы и приводятся в следующей таблице:
Нулевая Альтернативная Р-значение
гипотеза гипотеза
Но- м1 -Мг = <5 н,\ м,-м1 > 6 Р = Рг(Иу)>10)
Нх: рх- м1 < 6 Р= Рг(1(у)<1о) Л
Н%: р\- нгФ & Р = 2Рг(Г(*)>\10\)
Если в дескриптивной программе пакета не предусмотрен вывод на печать ковариационной или корреляционной матриц, то ^-статистика может быть вычислена посредством преобразования Б = Хг — Х2. Тогда выборочными статистиками для наблюдений &1 — Хц — %,( = 1, ..., п, и будут искомые й и В этом смысле парный ^-критерий совпадает с Лкритерием для выборки, состоящей из разностей а\, I = 1, п.
Пример 2.3.1 (продолжение). Проверим гипотезу: ^ = среднее венозное рН меньше, чем ц2 = среднее артериальное рН, т. .е. Н0'- Мч — ц2 = 0 и Ну. ^ — ц2 <0. Из (2.3.3) следует, что
1 = (7.373 — 7.413) УШ___2 71
Уо. 1253 + 0.1184 — 2 (0.1101) ~~
с V = 108 — 1 = 107 степенями свободы. Так как Р-значение менее 0.005, мы отвергаем Я0, что и следовало ожидать на основании медицинских фактов. Разбор этого примера будет продолжен в разд. 3.1.
Замечание 2.3.1. Пары наблюдаемых значений могут возникать тремя способами. Во-первых, можно делать два измерения у каждого индивидуума: например, Хг — длина правой руки, Х2 — длина левой руки. Во-вторых, можно измерять у каждого индивидуума одну и ту же характеристику до и после лечения: например, производительность сердца до и после приема лекарств. В-третьих, можно измерять одну и ту же случайную величину в парной выборке, т. е. у пар индивидуумов, выбранных из-за их сходства по отношению к цели измерений. Этим достигается возможность контроля над внешними факторами и увеличение чувствительности эксперимента. (Лечение между членами пары должно распределяться случайно.)
2.3. Анализ двух непрерывных случайных величин
89
2.3.2. Две популяции. Одна случайная величина
Рассмотрим случай, когда данные относятся к одной непрерывной случайной величине X, определенной на популяциях №х и \Р2. Эти две популяции можно рассматривать как подпопуляции или слои из более широкой популяции №. В этом случае популяция № расслаивается на №х и №2. с помощью случайной величины У, определенной на №. Например, пусть случайная величина X — = 10, определена на выборке из всех студентов колледжей США. Величина У = пол расслаивает № на две подпопуляции: №) = = студенты-мужчины и №2 = студенты-женщины. При этом X, определенное на выражает 1(3 для студентов-мужчин, а X, определенное на №2, — 10, для студентов-женщин.
Пусть цс и а] суть среднее и дисперсия X на №ь 1 = 1, 2. (Заметим, что в этом случае ковариация и корреляция не имеют смысла.) Из популяции №* производится случайная выборка объема щ и у каждого индивидуума выборки наблюдается величина X. Результаты наблюдений для выборок из №д и №2 обозначим СООТВеТСТВеННО Хц, #12, Х1,ц и #21, #22. ¦••> #2пг. ДЛЯ ПОСТрое-
ния гистограммы и подсчета статистик по каждой выборке можно дважды прогнать дескриптивную программу — по одному разу для каждой выборки. Другим путем для получения этой информации является использование дескриптивных программ с расслоением данных — таких, как ВЛШР7Т). Они строят гистограммы для Х'по каждой из выборок на одной и той же странице. Например, выдача может иметь вид
Для получения этих гистограмм входные данные могут быть представлены в виде
Группа 2
* * *л
•21
Выборка 1
Выборка 2
х-
'2
а значения пх и щ, задаются на управляющих картах. Другой способ состоит в том, что пользователь определяет переменную
Гл. 2. Элементарные статистические выводы
•У — так называемую переменную группировки, — с помощью которой выборочные значения классифицируются по подпопуля-циям. В этом случае результаты наблюдений можно представить в виде пар (хц,у(), которые вводятся в любом порядке. Например,как представлено здесь. В соответствии с признаком У программа раз х и деляет-наблюдения по двум выборкам. Для каж-22' дой выборки строится гистограмма и вычисляют-
Предыдущая << 1 .. 29 30 31 32 33 34 < 35 > 36 37 38 39 40 41 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed