Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
*)'**¦«> =
—оо —оо
ЧМ'+НЧ'-Н’] "’<'>=
— оо
+ оо
— | th dF(i),
—оо
следовательно,
оо
А — ) t dF(i) — х = О,
— оо
и точно так же
*?=Ш('+Н‘-('-Н’К<‘)==
— оо
оо
= ('(^+ -^3) dF(t) =
—оо
оо
= tldF{t) -!- i Лз
— оо
или
-(-оо
в=\* dFU) -У V = о-г + ^ А*.
— оо
Таким образом, математическое ожидание s'02, осредненное по всем возможным значениям t, на Л2/12 больше математического ожидания s2, равного сг2. Для того чтобы для о-2 получить несмещенную оценку, нужно из вычесть поправку Шеппарда Л2/12.
Эту же самую поправку применяют также н при вычислении s-. Сначала вычисляют
- ,т-1x24k —ЛП2
и из s'2 вычитают li-j 12. при этом в среднем получается то же
§ 20. Другие числовые характеристики распределения 105
самое s2, которое можно построить непосредственно по первоначальным значениям1 сг,-.
Пример 13. В § 18 говорилось, что при вычислении s2 наблюденные значения х можно спокойно округлять таким образом, чтобы размах имел две значащие цифры. Теперь это утверждение должно быть подтверждено вычислением поправки Шеппарда. При этом мы предположим, что п не слитком велико и что случайная величина х распределена приближенно нормально.
Пусть каждое а",• округлено ближайшим целым числом и пусть размах W — х(п> —а:111 (т. е. разность между наибольшим и наименьшим наблюдениями) является двузначным числом
10 И7 < 100.
Мы можем считать, что квадратичное отклонение о- больше чем 2. Так как если бы было о- == 2, то, с большой вероятностью, все х, лежали бы в пределах х — 5 и х 4 5 и, против предположения, размах был бы менее 10. С помощью формулы для функции распределения, выведенной в § 17, последнее заключение можно было бы сделать более точным, но для наших целей уже достаточна приближенная оценка.
Округление сводится к группировке по интервалам (g— */г> <7 +’/г)-где g — целые числа. Математическое ожидан ие s2 превосходит 4, а поправка Шеппарда равна лишь 1/12. Следовательно, в среднем поправка Шеппарда составляет менее 1/48 ота2, т. е. лишь 2%. Соответствующая величина поправки для s отличается от s в среднем менее чем на 1 % и поэтому не имеет прак-тнческого значения.
При очень больших п или в случае распределения, сильно отличающегося от нормального, эти отношения могут оказаться менее благоприятными. Поэтому при больших п округление, осторожности ради, пе следует делать слишком грубо. Если размах W, вычисленный по округленным значениям, окажется меньше 20, то нужно округление произвести заново, сохранив дополнительно еще один десятичный знак. В этом случае, IV будет менее 200 и а всегда можно выбрать так, чтобы раэгности а",-—а были двузначными числами, которые можно легко возводить в квадрат.
§ 20. Другие числовые характеристики распределения
Вместо среднего значения а; часто пользуются медианой Q, которая для непрерывной функции распределения определяется как решение уравнения
^(0 = ^- (1)
Для распределений с симметричной плотностью вероятности и, в частности, для нормального распределения медиана ? равна среднему значению х.
В качестве приближенного значения медианы ? используют выборочную медиану Z. Если объем выборки является нечетным
1 Если график плотности F'(l) — f(t) не имеет соприкосновения высо-
кого порядка с осью Ot на концах интервала, в котором сосредоточено распределение вероятностей, то лучше не применять поправок Шеппарда.
— Прим. ред.
10G Гл. IV. Оценки функций распределения, средних значений и дисперсий
числом v = 2т— 1, то Z равна среднему члену х(т) вариационного ряда ?(1) < х(2) < . . . < х(п) (члены этого ряда являются элементами выборки х1; хг,. . ., хп, расположенными в порядке возрастания их величины). Если же объем выборки равен четному числу п = 2т, то Z определяется как арифметическое среднее членов х(т) и а;(т+1) вариационного ряда Z = (х<т) -)- ?(т+1))/2.
Вычисление выборочной медианы осуществляется легче, чем вычисление выборочного среднего М. Однако в случае приближенно нормального распределения выборочное среднее М заслуживает большего доверия.
А именно если элементы выборки являются независимыми одинаково нормально распределенными случайными величинами, то, согласно § 17, выборочная медиана Z распределена приближенно нормально с дисперсией
Это распределение получается следующим образом. Пусть точка А находится на расстоянии, равном единице от фиксированной прямой g (рис. 14), и пусть через точку А проведена произвольная прямая. Если X — точка пересечения этой прямой с прямой д, В — проекция точки А на прямую д и <р — угол, образованный отрезками АХ и АВ, то расстояние от точки X до основания перпендикуляра В будет равно