Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 27

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 21 22 23 24 25 26 < 27 > 28 29 30 31 32 33 .. 183 >> Следующая

Упражнения
Упражнения в этой н в следующих главах сгруппированы по номерам разделов. Во многих задачах используются наборы данных А и В, описанные в разд. 1.4. Этн наборы данных можно получить у авторов книги. Если читатель захочет, он может изменить условие задачи, выбрав случайное подмножество из этих наборов.
Раздел 1.7 (набор данных А)
1.7.1. Чтобы оценить степень готовности данных, проверьте совпадение значений переменных Ш, возраст, вес, пол, исход и тип шока в исходной (карта 1) и конечной (карта 2) картах.
1.7.2. а) Постройте плотность распределения исходных значений для каждой перемеииой. Какие непрерывные переменные выглядят симметричными (для симметричных распределений среднее, медиана н мода совпадают)? Какие распределения выглядят асимметричными? У каких переменных бимодальное распределение?
в) Попытайтесь «исправить» асимметричные переменные, такие, как среднее венозное давление, сердечный индекс, среднее время циркуляции, применив логарифмирование или извлечение квадратного корня. Используйте программы построения пробит-графика или построения гистограмм, чтобы эмпирически оценить, какое из преобразований лучше.
1.7.3. Используя программы построения таблиц сопряженности признаков, постройте таблицы для пар переменных: «пол» и «исход», «пол» и «тип шока», «тип шока» и «исход». Чему равны оценки вероятностей для комбинаций значений исхода и типа шока, исхода и пола, типа шока и пола? Не кажутся ли некоторые соотношения необычными?
1.7.4. Используя диаграмму рассеяния, сопоставьте систолическое давление с диастолическим (как по начальной, так и по конечной карте), а также систолическое давление по начальной карте с систолическим давлением по конечной. Можете ли вы обнаружить грубые ошибки, учитывая, что диастолическое давление всегда меньше систолического? Не видите ли вы какого-нибудь соотношения между систолическим давлением в начале и в конце? А что можно сказать об соотношении между этими двумя значениями давления в подвыборках, сгруппированных по исходу?
1.7.5 (набор данных В). Проверьте, отредактируйте и исследуйте этот набор данных.
2
Элементарные статистические выводы
В этой главе мы обсудим использование пакетов программ для оценки параметров распределений и проверки гипотез. В разд. 2.1—2.4 продолжим обсуждение использования программы подсчета частот для анализа дискретных наблюдений и дескриптивной программы для анализа одной или двух непрерывных переменных. Дисперсионный анализ, использующий дескриптивные программы с расслоением данных, вводится в разд. 2.4, ^-анализ с использованием программ перекрестного табулирования — в разд. 2.5. Дополнительные и современные критерии перекрестной .классификации приводятся в разд. 2.6. Наконец, робастные оценки положения описываются в разд. 2.7.
2.1. Программы подсчета частот. Анализ дискретных переменных
В разд. 1.7.1 программа подсчета частот была введена как средство проверки дискретных переменных и устранения грубых ошибок и/или выбросов. В настоящем разделе обсудим статистические выводы, которые можно сделать о параметрах исследуемого распределения с помощью таблицы частот. Сначала будет рассмотрен случай дихотомических наблюдений, а затем — многозначных.
2.1.1. Анализ дихотомических наблюдений
В этом случае популяция \У представляется в виде объединения двух непересекающихся классов А и В. Пусть р — доля индивидуумов в популяции, принадлежащих классу А, а <7 = 1 — р — доля индивидуумов, принадлежащих В. Следовательно, статистические выводы об этой популяции сводятся к исследованию пара-
3 А. Афифи, С. Эйзен
66
Гл. 2. Элементарные статистические выводы
метра р. Наша цель — оценить р и научиться проверять гипотезы относительно р.
По выборке объема п программа подсчета частот генерирует следующую таблицу:
Название переменной Класс Частота А г
В п — г
Здесь ли (п — г) — соответственно частоты появления классов А и В. Из этой таблицы можно получить для р следующую оценку максимального правдоподобия (МП-оценку) р:
р = г1п. (2.1.1)
Отсюда МП-оценка ц величины ц имеет вид
д=\-р = (п — г)1п, (2.1.2)
Чтобы проверить гипотезу Н0, состоящую в том, Что р равно некоторой константе р0 против одно- или двусторонней альтернативной гипотезы Нъ нужно вычислить Р-значение с помощью биномиального распределения Ьп(1, р) = (?) р1 (1 — р)п~1 (табл. 1, приложение II).
В следующей таблице приводятся формулы для Р-значения при разных альтернативных гипотезах. Если Р-значение меньше уровня значимости а, то гипотезу Н0 отвергаем.
Нулевая Альтернативная
гипотеза гипотеза
Н0: р = Ро Я,: р > р0
Я,: р < ро
Их. р Ф ро
Р-значение
Г = Х>.(|>о) Р = ? Ь.Ц,Ро)
1=0
Р = 2|тш> ( ? Ь,{1,р0), ? Ь.(1,ро) \.= о
Случайную величину X, имеющую биномиальное распределение, удобно записать в виде
1, если индивидуум принадлежит А, 0, в противном случае.
Выборочные значения будем обозначать хъ хп, где х( равно 0 или 1, I = 1, п. Поэтому МП-оценкой параметра р является р = х, где х — выборочное среднее, а я = 1 — х. Такое представление позволяет использовать центральную предельную теорему
Предыдущая << 1 .. 21 22 23 24 25 26 < 27 > 28 29 30 31 32 33 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed