Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
Се 2 , (11)
где х2 = У\ + • ¦ • + Ут- Все точки решетки, по которым нужно производить суммир! вание лежат в гиперплоскости следовательно, интегрирование распространяется лишь на эту гиперплоскость. Соответствующим ортогональным преобразованием величин ух можно добиться, чтобы эта гиперплоскость имела уравнение ут = 0, тогда плотность вероятности будет задаваться формулой
— - (У* + • * • + У* )
f(y1,...,ym-1) = Ce 2 1 (12)
Эта формула справедлива тогда, когда в пространстве А, в качестве начала прямоугольных координат ух,...,ут выбрана точка (Pi(d),. . рт(д)). Если же началом координат является
постоянная точка, не зависящая от 5, то (12) нужно заменить формулой
- н- №* - уГ>« + • ¦ ¦ + (»«-1 - ат-,)Ч
f(y»...,ym-i)=Ce 2 (13)
где у равны математическим ожиданиям у.
§ 50. Асимптотическая эффективность
249
Отсюда следует, что Т' обладает асимптотически нормальным распределением. Асимптотическое среднее значение и асимптотическая дисперсия оценки Т' равны, по определению, среднему значению и дисперсии асимптотического нормального распределения, т. е.равны среднему значению и дисперсии линейной функции
m m—l
Т'=2 СД- = Ъ0 Ь 2 Кук, (14)
i-1 к=1
вычисленным в предположении, что ylt. ..,ут-г имеют плотность вероятности (13). Так как коэффициенты с,- не зависят от п, а среднее значение и дисперсию Т' через эти коэффициенты можно выразить точно, то между асимптотической формулой для дисперсии и асимптотической дисперсией не будет никакого различия. Эю же самое справедливо и для
Таким образом, мы имеем ту же самую ситуацию, что и в теории наименьших квадратов. уи . . ., ут-у являются независимыми нормально распределенными случайными величинами с
единичными дисперсиями и математическими ожиданиями yit представляющими собой линейные функции одного параметра д. Оценка д’ по методу наименьших квадратов является несмещенной и имеет минимальную дисперсию. Оценка Т' также не имеет смещения, следовательно, ее дисперсия не меньше дисперсии оценки О'. Равенство дисперсий будет осуществляться лишь тогда, когда соответствующие коэффициенты линейных функций Т' и ь>' равны. Следовательно:
Среди всех регулярных асимптотически несмещенных оценок Т оценка наибольшего правдоподобия г) имеет наименьшую асимптотическую дисперсию. Если Т и д обладают равными асимптотическими дисперсиями и если в окрестности точки с координатами ht = p,(fl) обе эти функции разлагаются в ряд по степеням Л,- — р(, то по крайней мере линейные члены этих рядов совпадают-, следовательно, Т с вероятностью, сколь угодно близкой к единице, отличается от й величиной высшего, чем 1 f\[n, порядка малости.
Для того чтобы эту теорему можно было сформулировать короче, мы введем следующие определения:
Асимптотически несмещенная регулярная оценка Т называется асимптотически эффективной, если среди всех оценок с теми же свойствами она обладает наименьшей асимптотической дисперсией. Две оценки, Ти и Тг, называются асимптотически эквивалентными, если их разность D =¦ Т2 — Тг с вероятностью, сколь угодно близкой к единице, является величиной высшего, чем 1/|/и, порядка малости, т. е. если D^n стремится, по вероятности, к нулю.
250
Гл. IX. Оценка параметров по наблюденным частотам
Теперь указанную теорему можно сформулировать так:
Оценка наибольшего правдоподобия С является асимптотически эффективной, и каждая регулярная асимптотически эффективная оценка ей асимптотически эквивалентна. Асимптотическая дисперсия такой оценки равна 1/7(5) — обратной величине информации.
При более общих предположениях и, в частности, без предположения линейности функций p,(fl) эта теорема была доказана Нейманом1.
Пример 34. Согласно общепринятой гипотезе Ф. Бернштейна2, наличие у людей четырех групп крови: О (I группа), А (II группа), В (III группа)
и АВ (IV группа), вызывается тремя генами А, В и О, причем А и В до-
минируют над О. Если индивидуум имеет генную пару ОО, то его кровь относится к группе О. Генные пары АО и АА приводят к группе А, а генные пары ВО и ВВ — к группе В. Наконец, генная пара АВ приводит к группе АВ. Пусть
л, - Xl-, . . -1
п п
— известные частоты групп крови в выборке, состоящей из п индивидуумов, и пустьр, q иг (р + g + r= 1) — частоты генов А, В и О в крови населения. Требуется найти асимптотически эффективные оценки3 для р, q и г.
Мы предположим, что население хорошо перемешано, т. е. что оно не распадается иа почти замкнутые группы с различными распределениями частот генов. При этом предположении вероятность образования генной пары ОО равна г2, точно так же вероятность образования генной комбинации АО (или ОА) равна рт и т. д. Следовательно, вероятности того, что выбранный наугад представитель населения будет иметь группу крови О, А, В или АВ, равны соответственно: