Вероятность: основные понятия, структура, методы. - Скороход A.B.
Скачать (прямая ссылка):
![](/pic/spacer.gif)
![](/pic/spacer.gif)
р. р*п задается как функция на строках длины п, состоящих из
нулей и единиц, принимающая значения из [0, 1]; после того, как
проведены п экспериментов, мы получаем конкретную строку
экспериментальных данных и р*в принимает конкретное значение.
Оценка р* называется несмещенной, если Мр*=р. Для несме-
щенной оценки естественно оценивать ее качество с помощью
дисперсии Эр*. Она, вообще говоря, зависит от р. Несмещенная
оценка р* называется допустимой, если для всякой другой
несмещенной оценки р* не может быть Эр*<Ор* для всех р и
Бр*<Ор*, хотя бы при одном р. Если: оценка не является до-
пустимой, то найдется заведомо лучшая оценка, поэтому такие
оценки не стоит использовать.
Теорема 1. Если р* — несмещенная оценка для р, сущест-
вует оценка вида g(vn), где чп — частота, та,кже несмещенная и
%Ы<Ор;.
Доказательство. Положим £^„) = М (р*/у„). Тогда,
используя (1), получим
^\ 2 ЩрЦ^.....а (2)
1г<...<1т
М(р*/5;,,...,; ) есть значение функции р* на строке, у которой
единицы стоят на местах с номерами 1Ь 1т, а на остальных
местах стоят нули. Поэтому правая часть (2) не зависит от р,
ё(^п) — статистика. Имеем
мg (у„)=мм (р; | V,)=тР*п=р.
g{yn) — несмещенная оценка. Далее
о§ Ы=мё2 (V,,) - р2=м (М (Р; | V,,))2 - р2 <
<мм(р;2 к)-р2=мр;2-р2=Ор*л. □
Из теоремы 1 вытекает, что оценки вида обладают тем
свойством, что они не могут быть улучшены оценками из бо-
лее широкого класса. Поэтому можно ограничиться лишь та-
кими оценками.
Теорема 2. \п является единственной несмещенной оцен-
кой вида g(v»).
Доказательство. Пусть gm = Cng[~■'j■ Если —не-
смещенная оценка, то gm для всех р удовлетворяют соот-
ношению
п
т=0
или
Пусть 0</?0</?!<... <рп<\, 1-г^- = л*, Рк(\—Рк) п = ак,
Тогда gm удовлетворяют системе из п-\-1 уравнений
п
2 Х№т = йк, £=0, ...,«.
Так как хк различны, то определитель системы отличен от ну-
ля и решение единственно. □
в) Интервальное оценивание. Другой способ оценки
неизвестной вероятности — построение доверительного интерва-
ла. Пусть а* и р* —две статистики, удовлетворяющие условию
а*<р*. Интервал (а*, р"*) называется доверительным с уровнем
доверия е > 0, если каково бы ни было р
рк</><р;}>1-в. (з)
Простейший доверительный интервал для р можно построить,
используя оценку чп и неравенство Чебышева. Так как Мул = /?,
Dv„ = —-—<-;—, то
1
Р{\4п-Р\>с}<
4пс2
Следовательно,
Р
1
Полагая а* — чп--6* = vra-1---г=, получим доверительный
" 2 У «в 2 у па
интервал с уровнем доверия е. Очевидно, что среди всех ин-
13—2550 ЮЗ
тервалов с заданным уровнем доверия желательно найти ин-
тервал минимальной длины.
1.2. Эмпирическая функция распределения. Пусть теперь
эмпирическая информация состоит в последовательном изме-
рении некоторой величины, эту величину мы рассматриваем
как случайную, а измерения как независимые наблюдения.
Распределение случайной величины неизвестно. Другими сло-
вами мы последовательность наблюдений х\, Х2,...,хп рас-
сматриваем как совокупность независимых одинаково распре-
деленных случайных величин, функция распределения которых
F (х) неизвестна. К статистическим задачам относятся такие,
ответы на которые выражаются через функции от Х\, . . . , хп
(статистики) и не зависят от функции распределения. Обыч-
но имеется некоторая априорная информация о характере
функции распределения. Мы здесь рассмотрим случай, когда
о F(x) известно лишь то, что она непрерывна. Тогда с вероят-
ностью 1 величины Х\, . . . , хп различны. Пусть % имеет рас-
пределение F(x). Обозначим через Ах событие {£<х}. Имея п
наблюдений величины | (xt можно рассматривать как такие
наблюдения), мы имеем также п наблюдений над эксперимен-
том, в котором происходит или не происходит событие Ах.
Частота появления Ах в этих п экспери-
п
ментах будет — ^ 1{хк<ху Это выражение зависит от х, как
установлено в предыдущем пункте, это единственная несмещенная
оценка вероятности F (х), симметрично зависящая от 1/Х/г<х},
Функция
п
k—\
называется эмпирической функцией распределения. Она яв-
ляется статистикой со значениями в пространстве функций рас-
пределения, притом достаточной статистикой, т. е. условное со-
вместнее-распределение хи...,хп при заданном F* уже не зави-
сит от F (х). Чтобы установить это, рассмотрим вариационный
ряд наших наблюдений х\ < х\ < ... <х*п, где х\ определены
тем, что множества {x*v..., х'п} и {xu...,xk} совпадают (мы счи-
таем, что все наблюдения различны). Чтобы получить вариацион-
ный ряд, нужно наблюдения расположить в порядке возрастания.
Точки xt являются точками разрыва для Fl(x), при этом
Fn (х1-\-) — F*n(xl) = ~. Эмпирическая функция распределения
![](/pic/spacer.gif)
![](/pic/spacer.gif)
![](./design/pic/spacer.gif)
![](/pic/wildcat.gif)