Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 30

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 24 25 26 27 28 29 < 30 > 31 32 33 34 35 36 .. 183 >> Следующая

определяется как производительность сердца (л/мин), поделенная на площадь поверхности тела (м2).
На рис. 2.2.2 изображены три вида гистограмм X для п — 112 пациентов в критическом состоянии. Таблица частот, по которой построена гистограмма, приводится слева. По-видимому, здесь нет грубых оши-бок,так как все данные лежат в обычном диапазоне измеряемой величины. Полигон частот также изображен на рис. 2.2.2. Выборочной модой является х = 1.5.
Сердечный индекс X Интервал Частота
[0,1) [1,2) [2,3) [3,4) [4,5) [5,6) [6, 7) [7,8)
10 40 25 20 10 5 0 2
Третье применение гистограммы — построение эмпирического распределения как оценки распределения популяции. Это можно сделать прямо по гистограмме
2.2. Анализ непрерывных переменных
73
или по ненормированной эмпирической функции распределения (ФР). В разд. 2.2.2 мы обсудим критерии согласия, основанные на гистограмме или на эмпирической ФР. В настоящем разделе опишем построение этой ФР, а также оценку процентилей истинного распределения. Пусть
^ = 0, 7^ = /!, /=з = /1 + /2, ^+1= ЕЬ-
1=1
Тогда /*",- — число индивидуумов со значениями X менее С; — называется накопленной частотой в с,, / = 1, к. Ненормированной эмпирической ФРх) называется ломаная, соединяющая точки (съ ^), (с2, ^2), (ск+1, (рис. 2.2.3). Ломаная,
100.00 89.29
1.0000 0.8929
112
100 90 80
80.36 | 0.8036
.0 71.43 § 0.7143
о 62.50 * 0.6250 1 70 § в; о
§ 53.57 § 0.5357 § 60 К -° о
5 кл <ь п 44 64 50
§ 44.64 | 0.446
35.71 § 0.3571 26. 79 | 0. 2679
17.86 8.93 0
0.1786 0. 0893 О
40 30 20 10 О
123456789 Сердечный инЬекс, л/(мин-мг)
Рнс. 2.2.3. Ненормированная эмпирическая функция распределения величины сердечного индекса для 112 критически больных пациентов.
проходящая через точки {съ /Уя), (с2, /Уя), (сА+1, /^Уя), называется нормированной эмпирической ФР, а если каждое /Уя выражено в процентах — процентной нормированной эмпирш ческой ФР. Важно, что с помощью последней ФР можно получить выборочные процентили и выборочные процентильные ранги. Эти величины определяются следующим образом: <7-я процент тиль — это число хч, менее которого принимают значения с/ % выборки. Обратная по смыслу величина — процентильный ранг
х) Иногда вместо ФР говорят «кумулятивной ФР»,'— Прим. перев.
74
Гл. 2. Элементарные статнстнческне выводы
числа х — равна проценту д части выборки, значения в которой меньше, чем х. Особый интерес имеет 50-я процентиль, называемая медианой т, левее которой лежит половина наблюдений. Используются также процентили 25 и 75, называемые соответственно 1-я и 3-я квартиль, и процентили 10, 20, 90, называемые соответственно 1-я, 2-я, 9-я дециль. Пример 2.2.3 иллюстрирует, как эти величины можно найти по процентной нормированной эмпирической ФР.
Пример 2.2.2 (продолжение). С помощью гистограммы на рис. 2.2.2 легко построить ненормированную эмпирическую ФР. Соответствующая ломаная проходит на рис. 2.2.3 через точки (0, 0), (1, 10), (2, 50),' (3, 75), (4, 95) Д (5, 105), (6, НО), (7, 110), (8, 112). На этом рисунке приводятся также шкалы для нормированных накопленных частот — относительная и процентная. Например, у = 10 пациентов (8.93 %) сердечный индекс менее 1, у /^з = 50 пациентов (44.64 %) — менее 2 и т. д.
Пример 2.2.3. Для иллюстрации вычисления процентилей и процентильных рангов воспользуемся рис. 2.2.4, на котором
т 10-я процентиль
Рнс. 2.2.4. Процентная нормированная эмпирическая функция распределения для гипотетической выборки.!
нанесена процентная гистограмма накопленных частот некоторой гипотетической выборки. Например, чтобы получить процентиль х70, нужно из точки 70 вертикальной оси провести горизонтальную прямую до пересечения с гистограммой, а затем из точки пересечения провести вертикальную прямую до пересечения с горизонтальной осью. Абсцисса точки пересечения х70 =?4.4 и будет приближенным значением 70-й процентили. Чтобы получить
2.2. Анализ непрерывных переменных
75
процентильный ранг ц для х = 2, нужно выполнить обратную операцию, как это сделано на рис. 2.2.4. Тогда ордината ц = 25 точки пересечения и будет процентильным рангом х — 2. Из рисунка следует также, что медиана т, т. е. 50-я процентиль, или 5-я дециль, равна 3.3.
Четвертое применение гистограммы или таблицы частот — оценка моментов популяции. Обычно дескриптивные программы вычисляют выборочные статистики непосредственно по массивам исходных данных, включая как меры центральной тенденции распределения, так и меры его рассеяния. Например, дескриптивные программы обычно вычисляют и выводят на печать хшах и хааа — соответственно максимальные и минимальные значения выборки, и ее размах, равный хтах — хт1а. Выводятся также выборочное среднее х, выборочная дисперсия & и выборочное стандартное отклонение я, определяемые формулами
1 " х = — 2-1
52 = 7^гт1>-*)2
(=1
(=1 \ (=1 I
, (2.2:1)
я = + у 8я
В некоторых программах по исходным данным вычисляется и выборочная медиана т, равная (п + 1)/2-му по величине (начиная с наименьшего) наблюдению, если п нечетно, или среднему из п/2 и (п/2) + 1 наблюдений, если п четно.
Предыдущая << 1 .. 24 25 26 27 28 29 < 30 > 31 32 33 34 35 36 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed