Математика для экономистов - Красс М.С.
ISBN 5-94723-672-9
Скачать (прямая ссылка):
Перечень вариант и соответствующих им частот называется статистическим распределением выборки. Здесь имеется аналогия с законом распределения случайной величины: в теории вероятностей — это соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике — это соответствие между наблюдаемыми вариантами и irx частотами (относительными частотами). Нетрудно видеть, что сумма относительных частот равна
W-^n-Jn
(12-1)
Пример 2. Выборка Задана б виде распределения частот:
X1 4 7 8 12 17 п. 2 4 5 6 3
Найти распределение относ [[тельных частот и основные характеристики вариационного ряда.
12.1. Выборочный метод 219
Решение. Найдем объем выборки: л = 2 + 4 + 5+6 + 3 = 20. Относительные частоты равны: "/, = 2/20=0,1; !#,=4/20 = 0,2: IV3 = 5/20 =0,25; IV1 = 6/20 = 0.3; IV5 = 3/20 = 0.15 соответственно. Контроль: 0.1 + 0,2 + + 0.25 + 0,3 + 0,15=1. Искомое распределение относительных частот имеет вид
х{ А 7 8 12 17 W1 0,1 0,2 0,25 0,3 0,15
Мода этого вариационного ряда равна 12. Число вариант в данном случае нечетно, k = 2 • 2 + 1, поэтому медиана т,. = хя = 8. Размах варьирования, согласно формуле (12.2), R = 17 - 4 = 13.
12.1.4. Эмпирическая функция распределения
Пусть и, - число наблюдений, при которых наблюдалось значение признака X, меньшее .v. При объеме выборки, равном л, относительная частота события X < х равна njn.
Определение 1. Функция, определяющая для каждого значения х относительную частоту события Х<х,
F* (X) = UJn (12.3)
называется эмпирической функцией распределения, или функцией распределения выборки.
В отличие от эмпирической функции распределения P (х) выборки функция распределения F(x) генеральной совокупности называется теоретической функцией распределения. Различие между ними состоит в том, что функция F(x) определяет вероятность события X< х, a F* (л) — относительную частоту этого события. Из теоретических результатов обшей теории вероятностей (закон больших чисел) следует, что при больших п вероятность отличия этих функции друг от друга близка к единице:
HniP[| F(x)-F" U)I <є| = \ к >0. (12.4)
п—p Л
Нетрудно увидеть, что F* (х) обладает всеми свойствами F(Jt), что вытекает из ее определения (12.3):
1) значения F* (х) принадлежат отрезку [0, Ij;
2) F* (л) является неубывающей функцией;
3) пусть х„ и хм — соответственно, минимальная и максимальная варианты, тогда F* (х) = 0 при х < хт и F* (х) = 1 при х і хм.
220 Глава 12. Элементы математической статистики
Сама же функция F* (х) служит для оценки теоретической функции распределения F(a-) генеральной совокупности.
Пример 3. Построить эмпирическую функцию по заданному распределению выборки:
X1 2 4 G лг 1U 15 25
Решение Находим объем выборки: H=IO 4- 15 + 25 = 50. Наименьшая варианта равна 2, поэтому F* (х) =0 при х< 2. Значение А'< 4 (или .V1 = 2) наблюдалось 10 раз. значит. Г* (х) = 10/50 = 0,2 при 2 <х< 4. Значения Х< 6 (а именно Jr1 = 2 и х2 = 4) наблюдались 10+ 15 = 25 раз, значит, при 4 < .т < 6 функция F* (г) - 25/50 ~ 0,5. Поскольку х = 6 максимальная варианта, то F* (х) - 1 при дг > 6. Напишем формулу искомой эмпирической функции:
|'0. л- ? 2,
(Л)~ 0,5. 4<.v<6, [I -v>6.
График этой функции показан на рис. 12.1.
1
0.5
0,2
1-м-1-1-*-
0 2 Л 6 т
Рис. 12.1. График эмпирической функции по данным примера 3
12.1.5. Полигон и гистограмма
Каждую пару значений (.Tj1 г^) из распределения выборки можно трактовать как точку на координатной плоскости. Точно так же можно
12.1. Выборочный метод 221
рас сматривать и лары значений (л,, IVj) относительного распределения выборки. Ломаная, отрезкп которой соединяют точки (,г,. R,), называется полигоном частот. Ломаная, соединяющая на координатной плоскости точки (х„ I1/,), называется полигоном относительных частот. На рис. 12.2 показан полигон относительных частот для распределения, приведенного в примере 2.
(1,3
0,2
O1I
12 16
20
Рис. 12.2. Полигон относительных частот распределения по данным примера 2
Для случая непрерывного признака А' удобно разбить интервал (х„,ь„ -rmrtv) ег° наблюдаемых значений на несколько частичных интервалов длиной А каждый и найти для каждого из этих интервалов сумму частот л„ попавших в него. Ступенчатая фигура, состоящая на прямоугольников с основаниями длиной h и высотами n./h (плотность частоты), называется гистограммой частот. Геометрический смысл гистограммы: нетрудно увидеть, что площадь ее равна сумме всех частот, или объему выборки. На рис. І2.3 изображена гистограмма выборки объема и = 100.
Аналогичным образом определяется и гистограмма относительных частот. Высоты прямоугольников, составляющих ступенчатую фигуру, определяются отношениями сумм относительных частот, попадающих в интервал (хт,П + (J- I)A, Train + j'A), к длине интервала А, т. е. величинами U^/ft. В этом случае плошадь гистограммы отно-
4
А
2 \
О II) 20 30 40 50 00 70 л