Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
ными величинами с одной и той же функцией распределения F(t). Построим арифметическое среднее выборки
М = п 0?! + ¦ • . + хп) = - а;, (3)
М называется выборочным средним значением. Часто вместо М пишут х.
Величина М является случайной. Ее среднее значение равно
? М =.- М = -- + . . . -Ь - = х,
^ 11 1 п
(4)
§ IS. Выборочное среднее значение и выборочная дисперсия 99
а дисперсия, согласно § 3 (15), равна
•> 0-2 I I 0-2 0-2 0-2 /е\
°~М - п-> + 1- -ж - Я яг- V • (б)
Таким образом, дисперсия Af при больших п оказывается значительно меньше дисперсии отдельного наблюдения xt. Так как по неравенству Чебышева (§ 3 В) модуль разности М — х может яеляться с большой вероятностью лишь величиной порядка
СГ
°М — 77= ,
)п
то М является полезным приближенным значением для х. Это приближение тем лучше, чем больше п.
Точно так же для сг'1 имеется приближенное значение
4 = I 2 (®,- — *)2- (6)
Математическое ожидание Sq, очевидно, равно сг2.
Формулу (6) можно применять лишь тогда, когда х точно известно. Этого, однако, в большинстве случаев не бьшает. Поэтому здесь может помочь замена х на М. Но тогда, как показывают расчеты, выражение (6) несколько уменмлается. А именно, для произвольного а имеет место тождество
2? (Я-, — му- = 2' (г, — а)2 — П (М — а)*, (7)
которое доказывается так:
у; (X, — М)2 = V[(*/ _ _ щ — а)]- =
= 2 (xi — аУ — 2 2 (*/ — a)(Af — а) + п(М — а)2 = = 2 (*/ — а)2 — 2п (м — а) (М — а) + п(М — а)2 = = 2 (xi — а)2 — 71 (М — а)2.
Положив в (7) а = х, получим
V (д.. _ му = 2 (*/ — *)2 — <м — *)“• (8)
Если в (6) х заменить на М, то, как показывает тождество (8), правая часть (6), вообще говоря, уменьшится. Чтобы компенсировать это уменьшение, естественно сумму в левей части (8) разделить пе на ??. а на v — 1. Таким образом, получаем
s-
^ (*,. - Му-. (9)
7*
100 Г л. IV. Оценки функций распределения, средних значений и дисперсий
Вычисляя математические ожидания правой и левой частей
(8), найдем
(п — 1) g(s2) = па-2 — п-^—(п — 1) сг2
или
в(в“) = о-2- (10)
Следовательно, знаменатель п—1 в (9) обеспечивает равенство математического ожидания s2 величине <r2. s2 называют выборочной дисперсией, a s — выборочным квадратичным отклонением1.
Для упрощения вычислений s2 можно использовать тождество (7). Целесообразно поступать так:
1. Сначала числовые значения xt следует округлить таким образом, чтобы разность между наибольшим и наименьшим наблюдениями имела две значащие цифры. Практически это округление не окажет на s2 никакого влияния.
2. Затем у всех округленных xt можно отбросить занятую, т. е. помножить их на такую степень числа 10, чтобы все хЛ стали целочисленными.
3. По округленным значениям xt с помощью формулы (3) следует вычислить среднее М с одним запасным десятичным знаком.
4. Затем из интервала, в котором заключены все а*,-, следует выбрать «круглое» число а и образовать разности х{ — а. Контроль: сумма этих разностей должна быть равна п(М — а).
5. Разности xt— а не более чем двузначные целые числа, следовательно, их можно возвести в квадрат либо «в уме», либо с помощью очень короткой таблицы квадратов чисел.
6. После этого вычисляют 2(xi— а)2, а затем, по формуле (7), 2(xi — и. по формуле (9), s2 (при вычислении sl результат округляется до целых чисел)2.
7. Для контроля полезна формула (7) с а = 0:
(х, — М)2 = — п М2. (11)
Пример 12. Осадки за 90 лет в Ротемстеде (по книге R. A. Fisher, Statistical Methods for Resoarch Workers, § 14). В первом столбце указано количество осадков х (и дюймах), во втором — соответствующее количество лет к, в течение которых наблюдалось данное количество осадков. В качестве приближенного значения для выборочного среднего выбрано а-= 28. Третий столбец содержит разности х — а, четвертый — к (х — а), пятый — к (х — а)2.
1 Эта терминология не является общепринятой. Чаще выборочной
дисперсией называют величину — М)г/п, которая равна дисперсии
соответствующей эмпирической функции распределения. — Прим. перео.
2 В заключение s8 нужно разделить на 102Р, где р — степень, о которой
говорилось в п. 2. — Прим. перев.