Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 23

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 17 18 19 20 21 22 < 23 > 24 25 26 27 28 29 .. 183 >> Следующая

---XXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXX XX XXXXXXXXXXXXX XXXXXXXXXX XXXXXXXXXXX XXXXXX
---XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXX
XXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXxxxxxxxxxxxxxxx---XXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXX [XXXXXXXXXXXXXX XXX
;—xxx
----' -—XXX XXXXXXXXXXXXXX XXX XXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXX —
XXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXX xxx---
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXxxxxxx XXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXX XX XXXXXXXXX XX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX-
• 100.0
- 96.0
; 92.0 88.0
- 84.0
* 80.0
- 76.0
- 72.0
- 66.0
- 64.0
• 60,0
Ш ьь 0
Ш
J 48.0 44.0 40.0
• 36 ..0
- 32.0
- 28.0
--- - 24.0
xxx • 20.0
xxx - 16.0
XXX - 12.0
- 8.0
[XXXXXXXXXXXX - 4.0
140,0 155.8 171.5 187.3 201.0 218.8 234,6 2S0.1 266.1 281.8 297.6 311.4 329.1 344.9 160.6 176.4 192.2 407.9 147.9 163.6 179.4 19S.2 210.9 226.7 242.4 2S8.2 274.0 269.7 305.S 321.2 337.0 352.8 36C.5 184.1 400.0
Рнс. 1.7.3. Гистограмма распределении холестерина, полученная по программе BMD05D.
ных грубых ошибок или выбросов. Проверка показала, что у ^ = = 25 пациентов значения холестерина были больше или равны сх = 140,0 мг/100 мл, но меньше, чем с2 = 147.9 мг/100 мл, т. е, принадлежали интервалу [140.0, 147.9). Аналогичным образом,
1.7. Проверка данных
57
у /2 = 17 пациентов значения холестерина принадлежали интервалу [147.9, 155.8), у fA = 25 — интервалу [155.8, 163.6) и т. д.
Из рис. 1.7.3 заметно, что распределение имеет длинный правый хвост. В последующем разделе мы покажем, что при наличии такой асимметрии с помощью логарифмического преобразования иногда можно получить более симметричное или даже нормальное распределение.
1.7.3. Преобразования к нормальному распределению. Графические средства
Стандартные критерии проверки гипотез относительно средних и дисперсий обычно предполагают, что исследуемые величины нормально распределены. Если для конкретной выборки мы отклоняем гипотезу о нормальности, то для получения статистических выводов можно поступать разными способами. Например, если объем нашей выборки достаточно велик, можно предпочесть использовать стандартные критерии как приближенные. Другой путь состоит в применении непараметрических процедур (см., например, Noether (1967))- и третий — в подборе замены переменной, приводящей к нормально распределенной величине.
Найти преобразование, порождающее нормальное распределение, обычно непросто. Сами данные могут подсказать соответствующую замену. Для некоторых типов переменных используются стандартные замены: например, для измерении растений и животных часто подходит логарифмическая замена переменных. Иногда вид экспериментальной гистограммы подсказывает тип преобразования. Например, резко асимметричная гистограмма с большим правым «хвостом» наводит на мысль о логнормальном или %2-рас-пределении, так что могут оказаться уместными логарифмирование или извлечение квадратного корня. Если эмпирическое распределение бимодально, то экспериментатор, подозревая, что имеет дело со смесью двух распределений, может обрабатывать их независимо (Bliss (1967), гл. 7).
Отметим еще, что статистиками были разработаны процедуры для случаев, когда стандартное отклонение функционально зависит от среднего. Например, если стандартное отклонение пропорционально среднему, то используют логарифмическую замену, а если дисперсия пропорциональна среднему, то извлечение квадратного корня приводит к приближенно нормальному распределению. Один из способов выяснить эти соотношения между |1 и о состоит в том, чтобы разделить выборку на подвыборки, вычислить для каждой среднее и стандартное отклонение и начертить их. (Более полное обсуждение см. в книге Brownlee (1965), с. 144—146.)
Входящие в ПСП программы обработки гистограмм с выбором замены переменных за один проход выдают и гистограммы наблю-
58
Гл. 1. Введение в анализ данных
даемых величин, так же как и гистограммы любых желаемых функций от наблюдаемых величин. Исследователь изучает каждую гистограмму, стремясь найти похожую на нормальное распределение, а затем проверяет согласие с нормальным распределением для преобразованной величины, используя критерии, описанные в разд. 2.2.2.
Пример 1.7.1 (продолжение). На рис. 1.7.4 изображена гистограмма распределения логарифма холестерина сыворотки. Сравне-
HISTOGRAM OF VARIABLE 7
MIN - 2.U6127 "»Х ¦ '2.602059
2.1 2.2 2.2 2.2 2.3 2.3 2.3 2.3 2.4 2.4 2.4 2.5 2.5 2.5 2.5 2.6 2.6 2.6 2.2 2.2 2.2 2.2 2.3 2.3 2.3 2.1 2.4 2.4 2.4 2.5 2.5 2.5 2.5 2.6 2.6
200.0 • 200,0
196.0 - 196.0
192.0 - 192.0
iee.0 - 188.0
184.0 - 164.0
іао.о --- * 1ЯО. 0
2 76.0 - XXX --- - 176.0
172.0 - XXX XXX - 172 .0
168. 0 - XXX XXX XXX ¦ 166.0
Предыдущая << 1 .. 17 18 19 20 21 22 < 23 > 24 25 26 27 28 29 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed