Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
L(*|C) = - 2 - W + П-
Дифференцированием находим, что координата д точки максимума функции ?(а;|{>) должна удовлетворять условию
"v _?(х1г_с L = о
— (Xfc — О)2 1
(22)
Само собой разумеется, что при п = 1 решением уравнения (22) будет
С = хг.
При п — 2 получаем уравнение третьей степени
(J"i — 0) — в)2 + 1 ] -Ь (з-г — v) [(a-j — i)2 4- 1] =- О
(Xj < j-2 — 26) ( (j-j — v) (j-2 — t) -t- 1 j = 0,
§ 36. Вычисление максимума
193
которое заведомо имеет решение
fli = х ^ ^ (xi + *2)- (23)
Два других решения удовлетворяют квадратному уравнению С2 — 2S х + х2 -f 1 = О, которое можно записать так:
(S - х)2 = [ —Ij -1. (24)
Если расстояние между точками вспышек хх и хг меньше двух единиц, то уравнение (24) не имеет действительных корней и решение (23) является точкой максимума функции правдоподобия. Если это расстояние в точности равно двум, то нее три корня уравнения правдоподобия оказываются равными друг другу и снона — х— точка максимума функции правдоподобия. Если же расстояние больше двух, то (23) является точкой минимума, а оба действительных решения уравнения (24) — точками максимумов, одна из которых лежит вблизи от х1, а другая — вблизи от х2. Метод наибольшего правдоподобия не дает указания, какое из этих двух решений следует выбрать в качестве оценки для S. На практике обычно выбирают то из них, которое расположено ближе к середине фольги.
Для п> 2 уравнение (22) решают последовательными приближениями. В качестве первого приближения выбирают, например, выборочную медиану Z (если п нечетное, то 7j — координата средней точки вспышек, см. § 20). Тогда улучшенное приближение имеет вид 62 = + йц где
L'ix'Sj)
^ = (25)
Числитель в (25) равен левой части (22) при 6— а знаменатель представляет собой информацию /(i^) = то/(i^), где j(<?) можно вычислить по формуле (11):
Jw-fgf/a.la ,-0 Т _______!___*_if.
’ Jl/Г »J Id-«)¦+lJ (l-0)* + l *.](
u2 du 1
(u2 + l)3 = 2 ‘
—oo —oo —oo
Поэтому информация
Ц0)-.= п№=~ (26)
не зависит от S и, согласно (25),
2 4 хь — д,
- - L'(x\ Sj) = - У...... - —. (27)
1 п 11 п ^ (xk — SJ2 + 1 V '
Аналогичным образом можно получить третье приближение. Вообще, если т- е приближение Ст уже найдено, то (т + 1)- е приближение
получим по формуле
, _ * _i_ ^ V1 Хк ^т
8т+1 - ‘ _"7~
И к (хк — Пт)2 + 1
13 Б. Л. ван дер Варден - 1062
194
Гл. VIII. Оценки неизвестных параметров
Эти последовательные приближения очень быстро сходятся к некоторому пределу Ъ, который и прин имают в качестве оценки для д. При больших п дисперсия оценки д асимптотически равна
1 2
---= (28)
ЦП) п
Согласно § 20, дисперсия выборочной медианы дается асимптотической формулой
1 л2
------------= — . (29)
4п [/(fl|t?)]2 4п
Сравнение (28) и (29) показывает, что оценка наибольшего правдоподобия лучше выборочной медианы. В свою очередь, арифметическое среднее х много хуже выборочной медианы, так как дисперсия х не существует, а функция распределения х совпадает с функцией распределения отдельного наблюдения хк.
§ 37. Неравенство Фреше
От хорошей оценки Т неизвестного параметра С требуется, чтобы ее значения были, по возможности, близки к истинному значению д.. Качество оценки определяется главным образом двумя ее характеристиками: математическим ожиданием Т = QT и дисперсией
<4 = &(? - 'Ь2-
Так как математическое ожидание Q Т зависит от 0, то мы, вместо g Т, снова обозначим его Т. От этого математического ожидания будем требовать, чтобы оно было равно 0 или по крайней мере было близко к 0. Разность
т — о = е^т — о = ь(в) (1)
называется смещением или систематической ошибкой оценки Т. От дисперсии а\ будет требоваться, чтобы она была по возможности мала. Оценка с нулевым смещением и наименьшей дисперсией называется наилучшей несмещенной оценкой.
Можно легко указать оценки с нулевой дисперсией: для этого нужно лишь выбрать Т равным произвольной постоянной Т0, независимо от результатов наблюдений. Однако в этом случае, если Т0 сильно отличается от истинного значения д, нам придется иметь дело с большим смещением Т0 — t). Таким образом, обнаруживается противоречие между смещением и дисперсией: обе эти величины нельзя сделать равными нулю (за исключением тривиальных случаев, когда С заранее известно или когда 6 с вероятностью единица определяется результатами наблюдений).