Теория вероятностей и математическая статистика - Баврин И.И.
ISBN 5-06-005322-9
Скачать (прямая ссылка):
= ^[M(XlXi) + M(X1X2) + ... + M(XtXn)],
112но слагаемое этой суммы, у которого второй индекс равен /, т.е. M(X1X1), равно М(Х,2) = Dr + a2. У всех остальных слагаемых M(XlXj) индексы разные. Поэтому в силу независимости X1 и Xj (см. гл. II)
M(XlXj) = M(Xi)M(Xj) = M(X)M(X) = M2(X) = а2. Так как имеется п- 1 таких слагаемых, то
M(X1X) = 1[Д + а2 + (п-1)а2] = а2 + ^-. В силу свойства 1 дисперсии (см. гл. II) получаем
М(Х2) = D(X) +M2(X). Нами уже найден (см. пп. 2 и 3):
Поэтому
M(X) = М(Х) = а\ D(X) = ^Dt.
М(Х2) = ^- + а2.
Таким образом,
MKX1-X)2]= Dr+ a2-2((,2 + %-) + ?- + * Dr и не зависит от индекса суммирования і. Поэтому -M(S2) = ^n^Dt =V0-
Что и требовалось доказать.
В заключение этого пункта отметим, что если варианты х, — большие числа, то для облегчения вычисления выборочной дисперсии Db формулу (4.9) преобразуют к следующему виду:
Dt =^(X1-C)2-(х„-С)2, (4.11)
і = і
где С—ложный нуль.
Действительно, с учетом формулы (4.3) имеем
X (X, - С)2 - п (xt - С)2 = X *і2 -2С^х, + пС2- пх2 + InCxt -пСг =
і = і / = 1 / = 1
п п п
= Ix/- InCxt - пх2 + InCxt =Xx,2- пх2 = Xx,2- 2"? + =
I = 1 I = I I = 1
п п п п
= Ix2 - 2х„Х х, + пх2 = Х(х,2 - 2XiXt + X2) = Х(х, - х„)2,
( = 1 / = 1 I = I I = 1
откуда
Dt =^(Xi-Xt)2 = ^(Xi-C)2-(xt-С)2, і = і i = i
8 -4857 1 13Пример 3. Для выборки, указанной в примере 2 из п. 2, найдем А (ложный нуль остается прежним C= 72,00)
10 10
X U - С)2 = X aI = °>0144 + °'0049 + 0,0025 + 0,0049 +
/ = і / = і
+ 0,0100 + 0,0004 + 0,0049 + 0,0529 + 0,0121 + 0,0016 = 0,1086; (хв-С)2 = (-0,038)2 «0,0014. Наконец, согласно формуле (4.11)
A = 0,1086 -0,0014 = 0,0094.
4. Оценки параметров распределения. Одной из задач статистики является оценка параметров распределения случайной величины X по данным выборки. При этом в теоретических рассуждениях считают, что генеральная совокупность бесконечна. Это делается для того, чтобы можно было переходить к пределу при п -»где п — объем выборки. Для оценки параметров распределения X из данных выборки составляют выражения, которые^должны служить оценками неизвестных параметров. Например, X (см. п. 2) является оценкой генеральной средней, a S2 (см. п. 3) — оценкой генеральной дисперсии Dr. Обозначим через 0 оцениваемый параметр, через 0„ — оценку этого параметра [0„ является выражением^ составленным из X], X1, ..., Xn (см. п. 1)]. Для того чтобы оценка 0„ давала хорошее приближение, она должна удовлетворять определенным требованиям. Укажем эти требования.
Несмещенной называют оценку 0„, математическое ожидание которой равно оцениваемому параметру 0, т.е. Л/(0„) = 0, в противном случае оценка называется смещенной.
Пример 1. Оценка X является несмещенной оценкой генеральной средней а, так как M(X) = а (см. п. 2).
Пример 2. Оценка S2 является смещенной оценкой генеральной дисперсии А, так как, согласно установленной выше теореме (см. п. 3),
M(S2) = ^-Dr* Dr.
Пример 3. Наряду с выборочной дисперсией S2 рассматривают еще так называемую исправленную дисперсию S2 = -^-^S2,
которая является также оценкой генеральной дисперсии. Для S2 с учетом установленной выше теоремы (см. п. 3) имеем
M(S2) = M (тгу^) = ~~M(S2) = А = А-
114Таким образом, оценка S2 в отличие от оценки S2 является несмещенной оценкой генеральной дисперсии. Явное выражение для S2 имеет вид
52= -2- JI = -а-1X (Я - л2 = -lT І (Х- -
п - 1 и - 1 и ™ и - 1 ™
Т. Є.
(4.12)
/-і
Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки для того, чтобы не делать систематической ошибки в сторону завышения или ^занижения.
Состоятельной называют такую оценку 0„ параметра 0, что для любого наперед заданного числа є>0 вероятность jP{|0„-0|<e} при стремится к единице*. Это значит, что при достаточно
больших п можно с вероятностью, близкой к единице, т. е. почти наверное, утверждать, что оценка 0„ отличается от оцениваемого параметра 0 меньше, чем на є.
Очевидно, такому требованию должна удовлетворять всякая оценка, пригодная для практического использования.
Заметим, что несмещенная оценка 0„ будет состоятельной, если при п—ее дисперсия стремится к нулю: D(Qn) —> 0. Это следует из неравенства Чебышева ((2.33) см. § 2.8, п. 1).
Пример 4. Как было установлено (см. п. 3), D(X) = -^-. Отсюда следует, что несмещенная оценка X является и состоятельной, так как
Iim D(X) = Iim Щ- = Dr Iim 1 = 0.
ff-»™ ff-»™ " П-»™ 1
Можно показать, что несмещенная оценка S2 является также состоятельной. Поэтому в качестве оценки генеральной дисперсии принимают исправленную дисперсию. Заметим, что оценки S2 и S2
отличаются множителем который стремится к 1 при п —>
На практике S2 и S2 не различают при л >30.
Для оценки генерального среднего квадратического отклонения используют исправленное среднее квадратическое отклонение, которое равно квадратному корню из исправленной дисперсии:
S = J^T -ХУ- (4-13)
Левые части формул (4.12), (4.13), в которых случайные величины Х\, X2, ..., Xn заменены их реализациями X1, х2, ..., х„ и X —