Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 19

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 13 14 15 16 17 18 < 19 > 20 21 22 23 24 25 .. 97 >> Следующая

Предполагается, что на А, ЛР,
61
*А, *А9 (или на Ag,..., *A9g), а также на а9, Ь9" наложены определенные
условия, необходимые для существования интегралов (3.42), (3.43), а также
для существования решения стохастических уравнений, встречающихся в
дальнейшем.
Уравнение (3.2) обращается в стохастическое уравнение типа уравнений,
рассмотренных в § 2.2. В силу (3.43) и леммы 2.3 оно имеет вид
/ (0 - g = j \dt *А (у (т), т) / (т)+d*yp (т) Мр (у (т), т) / (т)] (3.44)
(при обратном течении времени). Согласно сказанному в § 3.1 решение этого
уравнения, когда оно существует и единственно, определяет полугруппу Ttu.
2. Рассмотрим теперь уравнение (3.17). Учитывая, что
(которая, вообще говоря, неравномерна по co€Q' и g? DL). Отсюда следует,
что предел в (3.45) совпадает с симметризо-ванным стохастическим
интегралом, определенным в § 2.1. Используя, кроме того, лемму 2.4, имеем
U
<АЧ _ 7 = м. [¦ 7 + _L м. + _L м) + ... j = = Д1гГ/+J-AL?+
24
из (3.15) находим
N-1
/V - 1 J
fA(ti)-g= ? jAZ., + -i-ALj+
Но в силу (3.13) и (3.15) имеем
Поэтому
Ц (О - г = S [ Лб + V АЧ + • • • ] /а(-'-+г,/+| ). (3.45)
Из (3.42) можно получить оценку
- AL3 ц- ... = О (Д3/2) 24 '
и и
+ dy9(x)Ap(y(x),x)f(x)]. (3.46)
Аналогичное рассмотрение можно провести и для других уравнений (3.19),
(3.4). В результате интегральные выражения с dL заменяются на
симметризованные интегралы того же вида с dL в смысле § 2.1. В частности,
Ф (t) - <р (s) = f ср (т) dL (т). (3.47)
4
5
Пусть операторы (3.42), (3.43) соответствуют одной и той же полугруппе.
Тогда решение уравнения (3.44) совпадает с решением уравнения (3.46).
Приравнивая выражения в правых частях и учитывая формулу связи (2.14)
стохастических интегралов, получаем отсюда связь между операторами А, АР,
с одной стороны, и *А, *А р, с другой. Именно, из
(2.14) при {ха\={Ур, /} имеем
1 ^ */4 1
*Apf dyp = d*yp*Apf - - fbpa dt - *A9b9f dt,
где
bpf = \\m±-[yp{tA-h)-yp(t)} [f{t + h)-f(t)].
Л4.0 h
В силу (3.44) bpf = -b pa* Agf. В итоге получаем
Ар - Ар\ А = *А -)---ду^~ ^р0-----2~ *А* АвЬр0. (3.48)
дЛ*
Будем предполагать, что операторы *Af*Aa, являются
°У<з
определенными на DL*, тогда операторы L (t), L* (t) имеют одинаковую
область определения: DL = DL*.
3. Введем пространство DL, представляющее собой пространство функций
g, таких, что ALg(zDL. Для этого пространства можно рассматривать
разложение
e^g==fI+AL+l_AL2 + H\ gf
\ z ' (3.49)
причем
Hg = 0{
63
Разлагая так каждый сомножитель произведения .. . e^-N-1 имеем
... eAL"-"? = Г/+ ]?д/., + -1-?д/.? +
i i
+ ^ДДД L^g + 0{{u-t)4'). (3.50)
i<i
Если здесь совершить предельный переход (3.16), то будем иметь
U
'd'taS - + L (^) - L (t) + j dL (т) [L (и) - L (т)]| g -+-
t
+ 0((u-t)4'). (3.51)
Операторы Ttu в данном случае удовлетворяют уравнению
U
dtTtu = / + j dL (т) Тхи.
t
Если искать решение этого уравнения при помощи последовательных
приближений
dtT\:+l) = I + j dL (т) 7t> (7(0) = 1),
t
то мы получим некоторое формальное разложение, первые члены которого
выписаны в (3.51). Укажем, кроме того, следующую формальную запись
решения указанного уравнения в виде упорядоченного экспоненциального
оператора:
Ttu = N ехр dL(t)j.
Здесь символ N обозначает хронологическое упорядочение стоящих за ним
операторов.
Сравним (3.50) с разложением
еШ)-те = j/ + L (и) _ L (t) + ±- [ L {и) - L (t) j2} g +
+ О (("_*)¦/,).
Их разность оказывается равной
ем, _ _ _ g&LN-l _ eL(u)-Ut) = _L ^ I" AL, AL . __ ДД .ДД. +
i<i
+ О ((и-*)*/,). (3.52)
64
Можно показать, что сумма коммутаторов
2=2 [д^д Li - д^д'^] =
= 2{[L w ~ L AL> ~ AL>- [L w -1 ^)]> (3-53)
/
есть
o(("_ о*/.).
В самом деле, подставляя (3.42) в (3.53) и пользуясь разложением
дА"
Ар (т) = Ар (t) + (t) [уа (т) - уа ft)] + О (t- т), (3.54)
убеждаемся, что
х ч г дА_ з
*<*)]><
X 2 si§n (/- 0 (^) - у а (01 &у9Ауц +
+ 0({u - ty/>) = 0{(u - tyL). (3.55)
Следовательно, из (3.52) согласно (3.16) имеем Ttu = eLM~Lm + 0({и -
f)V.) =1 + L(u) - L(t) +
+ -L[L(u)-L(t))' + 0((u-ty/>).
Отсюда легко получить одно выражение для Ttu, которым удобно пользоваться
при малых и-t = Д. Учитывая (3.42) и соотношение (3.54), получаем
L (и) - L (t) = A (t) Д + Лр (t) Дг/р +
дА, У.
+ ~§~ (t) ] \Уо (Т) - у а (01 dyp (т) + О т (3.56)
i
и, следовательно,
дА Ttu ~ I + A (t) Д -f Ар (t) Аур + -qA- (t) У +
+ у А> (0 Аа (t) АурАуа + О (Д3А), (3.57)
65
где
Дг/р = yt (и) - ур (t);
U
Уа? = j [Уо (t) - Ус (01 dy? СО-
t
4. Проверим выполнение в рассматриваемом случае использованных в § 3.1
и § 3.2 условий (3.24), (3.36), (3.37),
носящих коммутационный характер.
В соответствии с (3.21) и (3.49) имеем
Sv,+ 1= / + AL,+ -±-AL?+0(AV.); - I + ДД-i Н-- ДД-1 + О (As/z);
Vi^+1 =7 + AL-1 + AL; + Y (Ai-1 + AL<)2 + 0 (A% Отсюда получаем
V-nw - = y [AL-AL'~' - AL*-'ALt + 0 (AV')-
Производя разложение (3.54) в одной и той же точке t = ti для обоих
операторов, легко убедиться, что
AL,AL,_i - ALi-iALt = 0(А3У).
Следовательно,
UriA-r°( AV.). (3.58)
Предыдущая << 1 .. 13 14 15 16 17 18 < 19 > 20 21 22 23 24 25 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed