booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 16

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf

Предыдущая << 1 .. 10 11 12 13 14 15 < 16 > 17 18 19 20 21 22 .. 97 >> Следующая

однозначно (с точностью до эквивалентности) определяют решение f(t). Это
решение интерпретируется как Ttug, т. е. как результат преобразования
Ttu-Выше было показано, что подобные преобразования образуют полугруппу.
Элементы матрицы (Ts") ag, соответствующей этому преобразованию, как
легко понять, удовлетворяют уравнению
U U
Сгiuhg - 6ag = j *лау (т) (Тхи)Yfi dx + j1 d*ya (т) Aaya (т) (Ttu)y3
(3.7)
t t
или
t , *
(Tsl<)ag Sap = J (Tsx)ay Ayp (t) dx + J (TYOay-^y/Ja ^t) ^*Уа- (3.8)
s s
Последние являются конкретизацией уравнений (3.4).
Рассмотрим предел (3.1) для построенной таким способом полугруппы.
Теорема 3.1. Предел (3.1) для описанной полугруппы существует в среднем и
приводит к исходным операторам (3.6).
Доказательство использует приемы, обычные в теории стохастических
интегралов и уравнений. Чтобы избежать громоздких выражений, будем
полагать, что Ла3 = 0, аа =0. Это упрощение не связано с принципиальными
изменениями доказательства.
Возьмем А-разбиение Ч, •••, tiv интервала (s, и] и применим формулу;
(3.8) к каждому элементарному интервалу (tu /г-+1]:
(i+1
(Tt t )ag ^ag = (" iTtx)ay Ay^a(^) d* ya(x). (3.8a)
I 1 + 1 ti 1
i
Пользуясь этими равенствами, образуем выражение
л--1 5-t-i
¦Z = ^ ^"0 f Aap,a{t) d*уа (х)1\ =
/= 1 'г г,
N-l (i+l
= ^ ^ К^т)ау - бау] (Т) d*ya (т) (3.9)
i=l %
(второе равенство справедливо в силу (3.8а))
и рассмотрим его средний квадрат. Согласно обычному (например, Дуб (1],
стр. 400 и др.) правилу усреднения стохастических интегралов имеем
N- 1 li+1
MZ2 - J Л! {[(7^.г)ат Say] [(Дт)ау' - i=l t.
(3.10)
Say'] А ура (Т) Аурсг (т) Ьаа' (т)} dx.
Используем теперь формулу (3.7), которая соответствует интегралу Ито,
записанному для обратного времени:
t
(Дх)ау - Say = j d*ya (t') Лаба ("О (^г'г)бу
*i
Применяя теперь указанное правило усреднения для обратного времени,
получаем
М {[(Tf.т)ау бау] \(Tt.x)ay' бау'] Ау$аАу'$о'Ьаа' (У (т), т)} = т
= |* М {Ьрр' {у (Т ), Т ) АаЬр ) Ааб'р' (^т'т)бу (^т'т^б'у' X
t.
i
X Ay ра (т) Лу-ра' (т) boo' (т)} dx'.
Это выражение, как легко видеть, имеет порядок 0(т-ti) (т. е. 0(A)) в
предположении, что соответствующие моменты ограниченны. Оно является
подынтегральным выражением в (3.10), и, следовательно,
lim MZ2 = 0; 1. i.m. Z = 0
л^о
при любых а и |3. Учитывая определение (3.9) выражения Z, имеем
N-1 N-1 *1+1
1. i. m. ^[(Г^.+])ар -6ap] -1. i. m. ^ [ Лара (т) d*ya (т)
=0.
/=i '' /=i X
Но второй предел есть не что иное, как стохастический
интег-
рал
U
j Лара (Т) d*ya (T) = L* (и)ар - L* 0)ар.
S
Доказательство закончено.
Аналогичная теорема с соответствующими усложнениями может быть
сформулирована и доказана также для более
52
общего диффузионного случая, который рассматривается в дальнейшем в §
3.4.
3. Введенное выше семейство производящих операторов L* (t) является
достаточным для построения теории неоднородной полугруппы и теории
условных марковских процессов. Кроме него, однако, для некоторых целей
полезно также рассматривать другое сехмейство, играющее в теории
аналогичную роль.
Определим новое семейство производящих операторов L(t), t?T при помощи
предельного перехода
[L(u) - L(s)]g = lim [In ThU+ ...+ In Tt ]g (3.11)
Д-"0 ' ;v
(?№).
Входящую сюда логарифмическую функцию от оператора следует понимать в
каком-либо подходящем смысле. Ее можно определить, например, естественным
образом после приведения оператора к диагональному виду (если это
возможно), или определить при помощи разложения
оо
(1пЩ,+1)<Г=? -/)"?. (3.12)
п= 1
Последним целесообразно пользоваться, если это не связано с существенным
ограничением области определения DlCG производящих операторов L(t).
В случае полугруппы, однородной во времени, различные семейства
производящих операторов совпадают:
L (и) - L (s) = L* (и) - L* (s) = (и - s) А.
Распространяя на неоднородный случай известные положения однородной
теории (Лоэв [1], Дынкин [3]), будем предполагать, что пространство Db
является всюду плотным в банаховом пространстве G0C G. Представляет
интерес обобщение на этот случай теоремы единственности (Дынкин [3], стр.
47). Не проводя соответствующего доказательства, будем предполагать, что
единственность имеет место. Если предположить, кроме того, что уравнение
kf-[L (u) - L(s)]f = g
имеет решение f(zDL для любой g€G0 и любого д>0, u>s, то отсюда по
аналогии с известной теорией (Дынкин [3],
53
стр. 51-53) можно вывести, что операторы L(u)-L(s) однозначным образом
определяют* операторы exp [L(u)-T(s)] над пространством G0. Можно
доказать также, что при этом
exp [L(u) - L(s))g?DL при g{G0, ы>".
Для фиксированного А-разбиения рассмотрим теперь операторы
Т$и = ехр { [L (ti+i) ~~ 1 {*')]} ехр <L {tl+2) ~
- L (G+i)] .. ¦ exp {L (tN) - L(/at_i)), t? [tt, (,-+i) (3.13) и
соответствующую им функцию
fHt)=Ttg, g^G0. (3.14)
Из этого определения легко получить, что
/д (О ~ /д (fc+i) - {ехр\L - L (/,)] - /} /д (/,+,) и, следовательно,
f4t;)~g = 2 {eLit/+l)~L(ti)-!\JA(tj++ (3-15)

Предыдущая << 1 .. 10 11 12 13 14 15 < 16 > 17 18 19 20 21 22 .. 97 >> Следующая