Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 39

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 33 34 35 36 37 38 < 39 > 40 41 42 43 44 45 .. 97 >> Следующая

дул
3. Выразим оператор (6.26) через параметры т?, о?г-(р = 1, ..., 1\ г'=
1, ..., I'), имеющие тензорно-инвариантный характер (теорема 2.5). Для
этого используем формулы (2.26). Поскольку Ь9а на допустимом множестве
(6.18) не зависит от
132
а, то, очевидно, можно так подобрать орГ', чтобы они также не зависели от
а. Кроме того, взяв приращение
ЛсГрг' = рг Аг/Я + О (А) дУя
и записав равенство, аналогичное (6.29), нетрудно убедиться, что
да°г' U да9г- ГЯ
От' = - Ons'Ox's' не зависит от а. Применяя к этим ве-
дУя ' дУя
д апг, да"
личинам преобразование о-' получаем, что -- $ и -- (Тяг'1
q дУк ' дУя
•-2а"- 2тр не зависит от а. Отсюда имеем
aP'bpx'dyX' = my(jJ^ax'\'dyx- + ...;
i __i dax,s,
L9'\jp'r'yJX'r'4^X' ~г чор'Ор'
Gp'bp'X'CtX' - tTlp'CSp'r'Ox'r'tTlx' -J- tTLp-Op-Г'<3Х'r' - Ons' "t"
дУя
[Op' bp'x/] bx'n- ~ [ttlp'Oo'r'Ox'r'] Ox's'Gns' >
дУч дУя
где точками обозначены члены, не зависящие от а. Если подставить эти
равенства в (6.26) и учесть тождество
<5 г -1-1 1 д . _1 .
- [ftlp'Gp'r'Gx'r'Gx' s'J - т
дУя дуп
то оудем иметь
dyX' -
dL (/)ар = papdt + |с (а) dt + тр. (а) arlp-ar,.
mX'(a)dtj - - -^[Щр'(а)а^р-]Оял'Л|б"3. (6.30)
Здесь нами опущены члены, не зависящие от а, что связано с
преобразованием эквивалентности (5.30). Операторы (6.26),
(6.30) совпадают с точностью до эквивалентности.
4. Помимо найденных инфинитезимальных операторов,
можно получить выражения для операторов dL(t), dL(t) систем мер (5.49) и
(5.29). Формулы .перехода к этим мерам от Vs являются частными случаями
преобразования мер
(3.31). Для вычисления соответствующих инфинитезимальных операторов можно
применить теорему 3.3. Как указывалось в гл. 5, это приводит к формулам
(5.65), (5.68).
Чтобы конкретизировать выражение (5.65) для данного случая, учтем вид
оператора (6.26). Для сокращения записи
133
введем обозначения
Wa (0 = wt [x(t) = a]; va (t) = Vt \x(t) = a];
Mps V = ? Ф (a) P Iх (0 = a I = ]? Ф (a) wa (t)-
a=l
Тогда (5.65) примет форму
dl (t)ap = Pa^dt + |[ap. (a) - Mpsap-] bj'a'dya- -
- -y- [ap. (a) a". (a) - М^Яр-Яа-] bj'a- -
dt
2
da
p'(a)
дУл
daD, PS dyn
P'o
- 4- [ap. (a) - M ap-] -^?160,Л 2 J
дУл
Ja|3
(начиная с этого места, полагаем с = 0; Ъраа - 0). В соответст-
3
вин с этим основное уравнение (5.66) для апостериорных вероятностей будет
иметь вид
dwa = WyPyadt + wa [ap, (a) - Мр5яр<] bya'dya' -
- ~waUar (a)я<г (a) - Мр5яР'Я0'] bj^ +
+
да0, da.,
p-(a)-M, p
дУл
+ [Яр' (a) - M Яр
дУл
dbf}n.
дУл
Ьр'а'Ьа'л "Ь - Ьа'л| dt.
(6.31)
Это уравнение будет выглядеть несколько короче, если перейти к записи
уравнения в смысле Ито. Чтобы это сделать, можно воспользоваться
уравнением (5.61), которое заданТг инфинитезимальным оператором
dC (t) = dLx (t) - [W/CLj, (t)] (?2)
(cm. (5.60.а) или (3.64)). Здесь согласно (5.60.6)
dL, {t) Vt (?2) d-U (t) (Vt (?2) = J] яа (/)).
(6.32)
134
Подставляя сюда (6.24), имеем
dL, (t)aэ = Vt (Q) {pafidt + [a9- (a) bpWya.\ 6ap} -1-. (6.33)
V( (У)
Это равенство позволяет вычислить окончательный вид оператора dL, в
данном случае. Применяя формулу (2.15), совершаем преобразование
d* уа- - -----= ---------d*ya-----------bVa'dt. 16.34)
V,(Q) V,(Q) IV ЛЩ*
Здесь
bVa, = lim -i- MAK, (Q) Aya. = V baa'\
д->о A ^
a
baa' = lim - M AuaAr/a. д->о A
- параметры, которые легко вычислить при помощи уравнения dVt = Vtd*L*
(5.56), т. е. уравнения
dva = Vypyadt + vaa9-(a) bp\'d*yv. (6.35)
Они оказываются равными
baa' = Vado' (a); bVa- vaaa' (a) = Vt (Q) Mpsa0'. (6.36)
a
Подставляя (6.34), (6.36) в (6.33), получаем
dL, (/)af3 = pafidt + aP' (a) b~.la. (d* ya- - Mpsaa.dt) 6ap.
Далее, подстановка этого результата в (6.32) дает
dV (t)afi = Pafidt + [ар- (a) - Mpsap-] bp],- (d*ya¦ - Mpsaa-dt) 6ap-
(6.37)
Уравнение (5.61), следовательно, принимает вид
dwa = WyPya + Wa [ap- (a) - Mpsap<] bp"' (d*Уа' - Mpsaa'dt). (6.38)
Оно эквивалентно уравнению (6.31).
Принимая во внимание найденную формулу (6.37), нетрудно проверить
выполнение соотношения (5.74).
Продолжая приведенное рассмотрение, можно конкретизировать применительно
к данному случаю также уравнение
(5.62). Кроме того, можно найти другой инфинитезимальный
оператор dL и записать соответствующие ему уравнения. Не останавливаясь
на этом, ограничимся тем, что приведем вы-
135
ражение для указанного оператора:
I V"(P'a) -хй
Рар при а ф Р;
" ^ I Vi (о , Q)
dL(tU^d'L(t)afi = dt} (6.39)
yi V?(y,Q) .
/ I Pay -------, при а = p.
V"(a,Q)
В нем оказались отсутствующими члены с dy0'. Причиной этого является то
обстоятельство, что в данном частном случае в выражении (6.24) для dL*
члены с d*ya- стоят лишь на главной диагонали. В других примерах (скажем,
в примере гл. 7) положение может оказаться иным.
§ 6.4. ВТОРИЧНЫЙ АПОСТЕРИОРНЫЙ ОПЕРАТОР
Любая мера V в пространстве Ет определяется значениями va =V(a),"=-l,
..., т. Поэтому процесс {1А(Г), ГСВ(tm)}, образованный апостериорной мерой
Vt на Ет, сводится в данном случае к m-компонентному процессу {гц(/),
Предыдущая << 1 .. 33 34 35 36 37 38 < 39 > 40 41 42 43 44 45 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed