Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 20

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 14 15 16 17 18 19 < 20 > 21 22 23 24 25 26 .. 97 >> Следующая

Перейдем к (3.36). Учитывая (3.49), а также аналогичное разложение для е
2 и eALi'+AF', непосредственно получаем
-~2 AFieALi+AFie~~AFi - eALi = О (А3/*). (3.59)
Несколько сложнее проверка последнего условия (3.37). Составим для
операторов АЦ разность
eAL' .. . еА%-' - [/ + AL1 + .. . + AL"_, +
(3.60)
+ i- (al; +... al;_i)2 +...] = л^+0((И-tyiо,
аналогичную (3.52). При этом согласно (3.34) имеем
^ [AL - AL - - AL'-AL ¦] =
*</
66 •
= ?\[L' (/,-) - L' (t)] al; - al; [U (/3.) - L' (/)]} + Од (1).
/
Подставим сюда (3.33) и явные выражения для оператора
t.
U (t}) - L' (t) = f [A' dx + А; dyp (t)];
i
(Л' (т) = e~F*A (т) eF* + / (т); А'р (т) = e~F*Ae (х) Л + /Р (т); d/ч = /
(т) dt -f /р (т) dy? (%)).
После этого по аналогии с (3.55) получим, что %' = 0((u-tW + Ob( 1).
Совершая предельный переход, из (3.60) при учете (3.34) поэтому будем
иметь
limeAL> ... e4?-Jv-i_e^'(")-^w =. О ((и - tyty. (3.61)
д-"о
Выведенные соотношения (3.58), (3.59), (3.61) согласуются с условиями
(3.24), (3.36), (3.37), но в отличие от этих условий нами здесь не
доказано, что оценки 0(&3/г) выполняются равномерно по всем g?D2L,
поэтому из (3.58), (3.59),
(3.61) еще непосредственно не следует справедливость этих соотношений
для замыкания пространства D2L. Мы не будем проводить более сложного и
полного обоснования указанных условий, а приведем независимый от этих
условий вывод главного результата, используемого в дальнейшем, - теоремы
3.3.
5. Для краткого вывода формулы (3.32) воспользуемся
тем, что симметризованные стохастические интегралы, как
отмечалось в § 2.1, допускают простые правила преобразования.
Функция
/(0 = j \Lta(X> dx')g(x'),
t
как указывалось, удовлетворяет уравнению (3.46), т. е.
- df(t)=dL{t)f(t). (3.62)
Согласно формуле (3.31) преобразования мер, имеем
U
Г (0 = j н*, (X, dx') g' (х') = e~Ftf (t), (3.63)
t
67
если
eF"<x)g'(x) =g(x):
Применяя к (3.63) обычные простые правила дифференцирования, получаем
df (1) = e~Ft df {t) - dFte~Ftf (t).
Подставляя сюда (3.62) и снова учитывая (3.63), находим df' (t) = - (e~F'
dL (t) -f dF#rF*\ f (t) =
= - [e~F* dL (t) eF' + dFt] f (t).
Сравнивая этот результат с уравнением df' (t) = -dL' (t)f' (t),
имеем
dL' (t) = e~F' dL(t) eFt -f dFt,
что совпадает с (3.32).
Дадим также вывод формулы (3.38), которую можно записать
dL'* (t) = e~F' d*L* (t) eF' - d* (e~Ft) eFt. (3.64) Преобразуя правую
часть равенства
/' (О (f/+0 = e~Ftif Vi) - (tl+l)
к виду
e~Fti If Vi) - f (ti+i)] - [e~Fii+l - e Fit\ f (fi+J) и суммируя no i,
имеем
/' vd - r (tN) = 2* te~F'* [f - f ~
i=i
- [e-F/-+i - e~F''] f (^-+i)} •
Подставим сюда
C+i '/+i
/ Vi) - / (* ж) = J dL (t) f (t) - j d*L* (T) / (t)
и совершим предельный переход Л->0. Используя определение стохастического
интеграла Ито и лемму 2.3, получаем
/' (0 - /' (и) = j e-F' d*L* (х) f (т) - J d* (e~F' )f(x),
t t
т. e. формулу (3.64), поскольку /(т) = eFx f' (т) и
§ 3.4. ДИФФУЗИОННЫЕ ОПЕРАТОРЫ И СТАТИСТИКА ПРИРАЩЕНИИ
1. Сделаем еще несколько предположений относительно специального вида
операторов L(t) и фазового пространства Е. Пусть Е-m-мерное вещественное
пространство Rm с определенными на нем борелевскими множествами.
Координаты этого пространства будем обозначать x={xi,..., хт }. Операторы
L(t) будем предполагать диффузионными, т. е. примем следующий конкретный
вид входящих в (3.42) операторов:
А (у, t) = с° (х, у, t) + а°а (х, у, t) -j- + - 6(r)р (х, у, t) ;
Cl op
А (У, t) = с(r) (х, у, t) + a°fa (х, у, t) ^- . (3.65)
ха
Здесь предполагается суммирование по индексам а, |3, пробегающим значения
1,..., т. Функции с°, аа и др. удовлетворяют условиям ограниченности и
однократной дифференцируемости по всем аргументам.
В соответствии с формулами связи (3.48) тем самым определены аналогичные
выражения для второго семейства операторов:
'A(y,t) = 'c°(x,y,t)+'a°(x,y,t)^-+-\-*b°(x,y,t) 92
дха 2 "Р дха дхВ
(3.66)
Мр (у, t) = с(r) (X, у, t) + а(r)а (х, у, t) ,
°ха
где
1 / дс(r) дс° \
v = с. +
69
*&°"
ap
-d/
6ap + a°Paa2fA"-Уравнения (3.46), (3.44) теперь принимают вид i/ , 1 "i
*v
"Эх,
с0/ + a° --1-----------------------5°.
2 аР (Эха <Эхр
Л +
¦df
*c°f + "a°n +
Ср/ + аР" ff~~\ ^9' (3.68)
а <Эх"
+ d у?
c°f -4- а1 d ^ йх,
- *6°
2 "Р сЭхасЭхр
.о V
dt +
Кроме них, можно также рассматривать уравнение
АО* 52/
df
с°У + а0* + - й°
а дха 2 "Р 5xadxp j
+ a°pad,d?
df
дх"
dt + с°9 d*yef +
(3.69)
коэффициенты которого нетрудно связать с коэффициентами (3.67). Пользуясь
формулой (2.15), где {ха\ заменяются на { у?}, имеем
= d" у pd
о .
pa
да"
дУо
дсГ
бро dt 1
с° d"у9 = d*у?с° - -X Ьеа dt. р р
Подставляя эти выражения в правую часть (3.69) и приравнивая ее правой
части второго уравнения (3.68), находим

со* = *с° + Ь90; а°а
дУа
да
pa
дУа
Ь9°> %
*ь°
ар
и в силу (3.67)
1 f дс° дс°а \
со* = С0 + _L ( С0С0 + ао -Е_ + -L ) А
г 2 V р а р" дхл ^ дУо ) '
(3.70)
1 да\
да(r)
а° + ( с°а° + - а\ -- +
"Т1 2 РР дх& 2 дг/,
^ар = ^"р + apaaVV.
Предыдущая << 1 .. 14 15 16 17 18 19 < 20 > 21 22 23 24 25 26 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed