Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 50

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 44 45 46 47 48 49 < 50 > 51 52 53 54 55 56 .. 183 >> Следующая

Пример 2.6.6. В исследовании, направленном на выявление ранних симптомов выздоровления детей, больных полиневритом ОшНат-Ваггё (ЕЬег1е е1 а.1. (1975)), 47 детей наблюдались до полного выздоровления (хорошее или нормальное напряжение во всех группах мышц) или три года при неполном выздоровлении (недостаточное напряжение по крайней мере в одной группе мышц). На основе четырех первоначальных мышечных измерений, в каждом из которых использовалось 6 уровней — нулевой, очень слабый, слабый, недостаточный, хороший и нормальный, была сделана попытка статистического предсказания выздоровления. Так как признак А (сила мускулов) и В (выздоровление) упорядочены и асимметричны, то использовалась мера В Сомера. В сле-
5*
132
Гл. 2. Элементарные статистические выводы
дующей таблице содержатся результаты исследования. Согласно этим данным, три из четырех первоначальных измерений значимо предсказывают исход заболевания.
Полное Неполное выздоров- выздоров- и Сомера ленне, % ленне, %
Сильная слабость в
дистальной части верхних конечностей днстальной части нижних конечностей Отсутствие глубокого сухожильного рефлекса в верхних конечностях нижних конечностях
61.1 90.9 0.25 * 66.7 100.0 0.31 **
41.2 72.7 —0.23 64.7 90.9 —0.24 *
* р < 0.05. ** Р < 0.01.
2.7. Робастные оценки
В разд. 1.7 мы обсуждали использование программ из ПСП для обнаружения выбросов. Но мы ничего не говорили о том, что делать с выбросами после того, как они обнаружены. Многие исследователи исключают из рассмотрения случаи с выбросами, потому что они по определению не относятся к изучаемой популяции. Другие исследователи после удаления выпадающих наблюдений исследуют их отдельно, потому что во многих случаях выбросы представляют больший интерес, чем вся остальная выборка. Нетрудно представить себе ситуацию, когда аномальные наблюдения оказываются самыми интересными находками.
Некоторые исследователи оставляют выпадающие наблюдения в наборах данных, особенно когда для каждого объекта определяются несколько показателей. Пусть, например, для данного случая измерялось три показателя Хи Х2 и Х3, и значение показателя Ху оказалось крайним, а показателей Х2 и Х3 — нет. Удалив этот случай из выборки, мы потеряем потенциально важную информацию о переменных Хг и Х3. Вместо того чтобы удалять выпадающие наблюдения, можно использовать процедуры оценки параметров распределения, нечувствительные к структуре данных. Такие процедуры оценивания называются робжгпг ными.
2.7. Робастные оценки
133
Многие робастные оценки были предложены и исследованы в Принстонском обзоре 1972 г. и изложены Andrews et at. (1972 ). В настоящем разделе мы рассмотрим три робастные процедуры: винзоризованные оценки, усеченные оценки и кусочно-линейные М-оценки Хампеля. Эти процедуры, вычисляемые и печатаемые программами BMDP7D и BMDP2D выбраны потому, что они наиболее робастные по сравнению с остальными (Andrews et at. (1972)).
2.7.1. Винзоризованные оценки
Винзоризованные оценки применяются при оценивании среднего и дисперсии распределений, при построении доверительных интервалов, а также при проверке гипотез относительно генерального среднего в ситуациях, когда можно предполагать присутствие выбросов (Dixon, Tukey (1968)). В этой процедуре крайние значения в упорядоченном ряду наблюдений не отбрасываются, а изменяются. Обозначим через ух < у2 < ... <s уп упорядоченный ряд для выборки хх, х2, хп, состоящей из п наблюдений. Тогда g-винзоризованные наблюдения получаются заменой g первых наблюдений на yg+1, a g последних — на yn__g (при 1 < g < л/2). Таким образом, по определению
zi — z2 — ¦ * ¦ = zg — yg+i> zg+i = yg+t, 2<i< л —2g—1, (2-7.1)
При этом оценками среднего и. и дисперсии а2 исходного распределения служат
1 " г = — Е zi,
s
Приближенный 100(1—а) %-ный g-вuнзopuзoвaнный доверительный интервал для среднего
г ± *1_<«/2, (Н - 1) [^Ет] [у?=], (2.7.3)
где п = п — 2^. Для проверки гипотезы #0 : и. = и.0 соответствующий g¦вuнзopuзoвaнный односторонний 1-критерий использует статистику
I ^(к-\)У~п (г-\\)1(п-\)8г, (2.7.4)
а приближенное Р-значение получается из распределения Стью-дента сп — 1 = л — 2g — 1 степенями свободы.
п
»34
Гл. 2. Элементарные статистические выводы
Пример 2.7А. Рассмотрим следующие девять упорядоченных наблюдений 0.017, 0.018, 0.023, 0.031, 0.031, 0.033, 0.036, 0.070 и 0.079. Обычные оценки для среднего, стандартного отклонения и 95%-ного доверительного интервала для среднего равны: г = = 0.0375, s2 = 0.0222 и
0.0222
0.0375 ±*ми(8)
V9
= (0.0204, 0.0546).
Если g = 1, то ряд принимает вид 0.018, 0.018, 0.023, 0.031, 0.031, 0.033, 0.036, 0.070, 0.070, a h = п — 2g = 7. Соответствующие один-винзоризованные оценки среднего и стандартного отклонения равны г — 0.0367 и sz = 0.0199, а 95 %-ный доверительный интервал есть
/с, / 8 \ Г 0.0199 1
0.0367 ± L
0,975 I
V9
= (0.0151, 0.0583).
В следующей таблице приводятся ^-винзоризованные оценки среднего, 95 % -ные доверительные интервалы для среднего и длины этих интервалов при g = 0, 1, 2. Наименьший интервал получается при g = 2.
Предыдущая << 1 .. 44 45 46 47 48 49 < 50 > 51 52 53 54 55 56 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed