Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 91

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 85 86 87 88 89 90 < 91 > 92 93 94 95 96 .. 97 >> Следующая

Фоккера-Планка. Это дает равенства
а=-L; (31)
1 - а а
вместо соответствующих неравенств, полученных Вальдом для дискретного
времени. Границы областей остановки а, Ь, таким образом, не зависят в
данном случае от 0. Это свидетельствует о том, что оба средних времени
(27) минимизируются при (31) одновременно.
3. Сложная задача Вальда. Пусть теперь проверяется сложная гипотеза хС
со относительно сложной конкурирующей гипотезы х? со. Испытания по-
прежнему будем предполагать независимыми. Для простоты примем, что
множество X = coUto возможных значений параметра х есть одномерное
301
пространство, а ю - полупрямая х < 0, хотя, конечно, возможно обобщение
на более общие случаи.
В данном случае также будут справедливы формулы (7)-¦ (9), определяющие
апостериорную вероятность, если в них вместо W (х), Р (х) писать W (dx) =
w (х) dx и Р (dx) = = р (х) dx.
Чтобы условный риск зависел не от бесконечного, а от конечного множества
параметров (достаточных координат), требуются дополнительные, упрощающие
предположения. Так, положим, что априорное распределение гауссово
(х-т0)2
PW = W-е 2(J2° ,
V 2л 0О
a St (х)-линейная функция от х : St (х) - qt + rt х. Тогда апостериорное
распределение также будет гауссовым
1 __ (*-т)г w(x) = -1- е 202 , (32>
у 2л а
где
=-V + - [r\dr,
On X .) х
о
t
т = °2 + - f (Ух - <7т) ГХ dx
L од * J
(33)
Легко видеть, что последние равенства эквивалентны уравнениям
2 г?
-do - - dt;
03 к
(34)
с соответствующими начальными условиями с = сто, т = т0 при t = 0.
Пусть требуется принять решение и = sign х при таких же штрафах за
неправильное решение и за время наблюдения, что и в предыдущем примере:
/ А при х>0, и = - 1;
Cit(x, и) = j В при х<0, и ~ 1 (35)>
^ 0 в других местах
Cti (х, и) = С.
302
Функция sft(ua Iу*0) = MpsC'tt(xt, Utt) (ср. с (9.4)) теперь зависит от
у*0 только через посредство о, т (33). Учитывая (32),. (35), находим
л[т + /7(р)] при и' = ~1\
В^-^р)], "' = 1,
где р =-a F (р) - функция (З.а). о
Условный риск, зависящий от о, т, или, что то же, от а, р, определяется
уравнением (10.12), принимающим вид
S (о, р, t) = min |/4
, В
В(р)
СА + MpsS (о г А о, р 4- Ар, t + Д)| + о (А).
(36)
Из (34) получаем
dp = - - о2р dt + - (y - q)dt.
2х к
При усреднении Mps заменим здесь (у - q) dt на (rx + l)dt = = rxdt + dl,
и учтем, что f\vsx = m = a\i, Mpsg = 0 и поэтому
Mpsdl* =
mps (Ар - м Ар)2 = -^1 Mps (Air =
2rr2
Mos,
2 Ps
д.
ps V"r ps
Следовательно,
MpSS (o -|- Act, p -|- Ap, t -\- A) = S (o, p, t -|- Д) -4-
Л Г ДС ДС Д2С 1
+ о(Д).
+ -- r2o2 2x
dS , dS , d2S
- a b p 1-------------------------
da dp, dp,2
(37)
(здесь учтено также первое равенство (34)).
Подставляя (37) в (36) и переходя к пределу А ->¦ 0, получаем, что S
удовлетворяет уравнению
dS = с+ г2°2
dt

d2S
dp2
dS dS
р-------------а------
dp da
когда
min |л
+ В(р)
, В
(38)
зоа
В остальных местах
S = min j^-i- + F(p) > в\\ ^(М-) } •
Область (38) является областью продолжения испытаний. На •ее границах р =
f х (a, t), р = fi (о, t), (f\ < f2), где
S(h)=A S(f2) = B
+ В (h)
[i
¦F(N)
, F(h)>
1 В - A '
2 A + B '
1 5 - A
2 A + B '
(39)
(40)
испытания заканчиваются принятием решения и - -1 (на /1) и решения "= 1
(на /г)- Как и в предыдущем примере, на границах выполняется условие
непрерывности производной:
ds
dS
Эр
А -4-
У 2л В
У 2л
при р = Д (cr, t); при р=f2(a,t).
(41)
В тех случаях, когда время наблюдения не ограничено и параметры задачи
(г, к, А, В и др.) постоянны, функция 5 не зависит явно от времени и,
следовательно, удовлетворяет уравнению
02S , dS
+ 11
as . 2хс
а 1---------------
0
(42)
Эр2 Эр да
с граничными условиями (41).
Наличие множителя о при -- упрощает приближенное решение данной задачи и
отыскание границ fi,2 (о). В первом
приближении можно, пренебрегая членом о- , решать урав-
да
нение
<э25Ц) , aso)
-----------р р--------
ар2 г ар
2 у.С
(43)
с тем, чтобы более высокие приближения находить по формуле
a2S(*+i)
11
as(*+i)
2хс , as(*)
+ tr-
ap2 ' 1 Эр г2 а2 ' да
Решение уровнения (43) при первом условии (41) имеет
304
вид
ц х2
= е" ^ I* - Г dх\ . (44)
dp \ р^2я r2a2 J )
tt
Учитывая второе условие (41), отсюда получаем f> Л1
j* е 2 dx = -
2 ^ " г2о2 -4 + S
ti
2'лС У 2л
Второе уравнение для определения /1 (а), /2(0) находим из условия
5(0, Д) - 5 (0, А) = -=-*- + ЛВ(А) + ВВ(А).
(см. (39), (40)).
Интегрирование равенства (44) поэтому дает
{ dye~ ~ f dxe~2~ = + (Л + B)F(f2).
fi fi
В симметричном случае, когда А = В, имеем /1 = -/2, причем
Ш) &
с j Аа2 А
е 2 dx
2 у 2л х С о
" / 2хС \'Л
11ри малых 0 <А --------- ) , следовательно, справедлива асимп-
V Ar2 J
тотическая формула
1 А
/2(0)^ -А. (45)
' ' У 2л 2% С
На основе полученного решения можно убедиться, что
отклонение S(1> - min Л^-^+Т7!, имеет порядок
2хС с2 А2 "2
/1,2-------------------Г202.
rV ' 2хС
^(0
Поэтому член 0------------- г202Л2/2хС, которым мы пренебрег-
да
ли, в (л202Л/2хС)2 раз меньше учтенного члена 2xCjr2a2. Следовательно,
Предыдущая << 1 .. 85 86 87 88 89 90 < 91 > 92 93 94 95 96 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed