Вероятность: основные понятия, структура, методы. - Скороход A.B.
Скачать (прямая ссылка):
R(Q,d*)=MeR(Q,d(xu...,xn)).
Естественно искать такое решение, чтобы средний убыток был
минимальным. Так как он зависит от 8, то трудно ожидать,
чтобы его можно было сделать минимальным для всех 0 сра-
зу^ Поэтому далее будут уточнены понятия, связанные с мини-
мизацией R(Q, d*).
Пример 1. (X,âS), х={0, 1}, J? — все подмножества X.
Распределение Ре определяется вероятностью Ре({1})=Ре, в =
= {0, 1}, D состоит из двух решений JO=(0=O), J| = (0 = 1).
Функция R(Q,d) определяется своими четырьмя значениями
R0,o=R(0, d0), Ro,\ = R(0, d\), R\,v=R{\, d0),RXA = R(l,d\). Пусть
#o,o<0, #ы<0, #o,i>0, Яьо>0. Решающая функция опреде-
ляется разделением всех n-мерных строк из нулей и единиц
на два подмножества £>0, где функция d(x) принимает значе-
ние 0, и Du где функция d(x) принимает значение 1. Если
d* определено двумя указанными множествами, то, обозначая
через п(х) число 1 среди координат, получим
же, с?*)=/?9,о2 р$(х)о-р»)п-п(х)+
= /?е.1 + (/?е,о - /?в.О (1 - РеГ ^ (т^Т^
Это задача о выборе из двух гипотез о вероятности события.
Очевидно, что £)0 нужно выбрать так, чтобы 2 (~_^° У*'*'
^ 1 —- г?0
была максимальна (Рт — ^?о1 <0), а 2 ("ГГГ-'—минимальна
(/?1о— /?и>0). Можно убедиться, что если область £)0 опре-
деляется одним из соотношений
то получаемые при таких решающих функциях значения
7? (8, й*) будут равномерно не больше, чем при других.
Пример 2. Х=Р, Я—борелевская а-алгебра, Р9 — рас-
пределение в Р, зависящее от вещественного параметра 6,
Р> = Р, решения заключаются в выборе значения параметра.
Я(в,с1) = (д—й)2. Решающая функция с?* = 6(хь . . . , хп) оп-
ределяет оценку параметра. Качество оценки определяется
среднеквадратическим отклонением
/?(в, с?*)=Ме(й?*-б)2.
Пусть, например, 6 — неизвестное среднее значение нормального
распределения с дисперсией 1. Если й* — некоторая оценка 9, то
Ме (с?* | х), где х = — (ххА- ... +хп), не зависит от 8; поэтому
это также оценка для 8, при этом
Ме (М9 (<** | х) - 0)2=М9 (Ме (ё* - 8 | х))2 <
< Ме (М9 ((с?* - 8)2 | х)) = Ме (с?* - 8)2.
Таким образом имеет смысл рассматривать лишь оценки вида
М^ (х). Если потребовать, чтобы эта оценка была несмещенной,
т.е. чтобы M.Qg(х) = в, то х будет единственной такой оценкой.
3.2. Минимаксные и байесовские решения. Среди всех
решающих функций естественно выделяется класс неулучшаемых
решающих функций: й* называется неулучшаемой, если из соот-
ношения Я(8, */*)>Я(е, й?*)> 060 вытекает Я(9, = #(8,
66®. Решающая функция й\ не хуже, чем решающая функция
а?*, если для всех 8 Я (8, о^Х^ (0, ^*). Класс решающих функ-
ций Ж называется полным, если для всякой решающей функ-
ции d* существует в Ж решающая функция d\* не хуже,
чем d*. Описание неулучшаемых решающих функций и пол-
ных классов — это то, что может сделать математика для ре-
шения поставленной задачи. Используются, кроме того, неко-
торые специальные решающие функции, которые также можно
рассматривать как решение задачи.
а) Минимаксные решения. Решающая функция
d* называется минимаксной, если, какова бы ни была реша-
ющая функция di*, выполнено соотношение
тах % (е, d*) < тах R (О, dl).
9 6
Минимаксное решение позволяет минимизировать максималь-
ный возможный убыток. Можно представить такую ситуацию,
когда именно такое решение естественно использовать, напри-
мер, когда нужно в любой ситуации иметь гарантированный
результат. Вообще, утверждать существование минимаксной
решающей функции нельзя, для ее существования нужны до-
вольно жесткие ограничения на семейство мер {Ре, 666}, про-
странство решений (D,2b) и функцию риска R(Q, d). В общей
ситуации интерес представляют е-минимаксные решения: та-
кие d*, чтобы
тах/?(9, öf )<minmax/?(e, cft) + e-
е d* е
Для нахождения таких решений нужно знать число
min max/? (е, ^) = /?min шах,
* е
которое называется минимаксным риском. Интерес представ-
ляют условия на функцию R(Q,d), при которых справедливо
соотношение
^minmax = maxmin^(6. dt) = max min R (0, d)
6 * 9 d
d\
(вычисление правой части — задача анализа).
"~i>) Байесовские решения. Рассмотрим случай, когда
имеемся некоторая дополнительная информация о семействе
{Ре, 666}— именно, задано некоторое распределение на
(в,'S7)—v(dQ) — априорное распределение параметра. Такое
априорное распределение может быть обнаружено в результате
многократных повторений одних и тех же ситуаций. Тогда
после выбора решающей функции d* средний риск (с учетом
распределения v(dQ)) будет
RJd*) = ^R(Q, d*)v(dQ).
Естественно искать решения, минимизирующие величину
Rv(d*). Если такое решение dv* существует, то будем назы-