booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 18

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf

Предыдущая << 1 .. 12 13 14 15 16 17 < 18 > 19 20 21 22 23 24 .. 97 >> Следующая

i
с условием (3.23). Отсюда следует, что оба оператора имеют одинаковую
область определения Dt, а также, что предел (3.11) существует и совпадает
с исходным выражением (3.21). Доказательство закончено.
57
§ 3.2. ОДНА ТЕОРЕМА О ЗАМЕНЕ СИСТЕМЫ МЕР
1. В соответствии с формулами (3.16), (3.19а), определяющими дифференциал
d, мы понимаем в более общем случае выражение
yi^Gt(x)~dRlI{x)Hq{x) (3.28)
я
в смысле
У Пт У Ga (tt) [eV''+i>-W -1] Hq {ti+l)
Д-"0 Я I
(если предел существует). Gq, Hg есть операторы или функции. Сказанное
относится и к тому случаю, когда оператор (или операторы) Rq
соответствуют умножению на некоторую функцию. Операторы или функции Rq не
обязаны иметь ограниченную вариацию или быть непрерывными.
Учитывая определение (3.28), нетрудно получить, что этот интеграл
обладает рядом своеобразных свойств. Например, выполняются равенства
U
f е"<т> dR (т) = в*<"> - е*<5>,
S
и
j dR (т) е-я<т> = е-я<5> - <?-*<">, (3.29)
S
т. е.
е(tm) dR (t) = de*(r)-, dR (t) e~m = - rfg-W), тогда как равенства
dR (t) = de*w>; е~*М dR (t) = -
- dR(t)-d[-R(t) ]
в общем случае являются несправедливыми.
Вместо dR можно писать e~Rd*eR, где дифференциал d* определяется формулой
f G (d*Q) Н = lim У G (*,) IQ (f,+i) - Q (C+0 (3.30)
i
Интегралы в (3.2), (3.3) являются частными случаями определения (3.30).
Как видно из (3.20), иногда удобно заменять дифференциал d от одной
функции дифференциалом d* от другой.
2. Перейдем к рассмотрению одной важной теоремы.
58
Для решения ряда задач полезно совершать замену марковской системы мер
при помощи формулы
р;Дх, А) = e~F*{x) j iist(x, dx')eFt(x'\ (3.31)
л
где Ft(x)-соответствующим образом подобранная функция на ТхЕ, измеримая
по Борелю на <ШтХ8.
Представляет интерес вопрос, как при такой замене мер преобразуются
производящие операторы. Пусть L(t)-операторы исходной системы ps;(x, А).
Введем операторы
t
L'(t)-L'(s) = j e~F' dL (т) eFx + F,~ Fs, (3.32)
S
где интеграл понимается в смысле
lim V e~Fi [L (ti+1) - L &)] eFig, F, (Ft. + Ft ),
д^о J 2 1
i
g^DLdDL.
Здесь и в дальнейшем, рассматривая А-разбиение {tt\ интервала [s, t],
будем пользоваться обозначениями
AL; = L (*ж) - L (f,); AFt = Ft.+l - Ft.,
AL; =L' (*,+,)-!'&)•
Кроме того, обозначим
AL] = e~Fi (ALt + AFJ A (3.33)
тогда согласно (3.33), (3.32) будем иметь
lim (АД + ... + A LN) = L'{t) - L'(s). (3.34)
д-"о
Условие (3.37) следующей теоремы отличается от этого соотношения
утверждением некоторых коммутационных свойств операторов АД.
Теорема 3.3. Если
|[ eAL' ji < еКА, (3.35)
а также выполняются коммутационные условия
е~ ТА VL'+A%~ ^ = А [I + о (А)], (3.36)
lim A1... eAV = eu(t)-L'(s) [7 + 0 у _ s)] (3.37)
д-"о
59
(оценка o(t-s) берется по норме и является равномерной, по всем t), то
преобразованию мер (3.31) соответствует преобразование производящих
операторов (3.32). Кроме того,
iL' (t) = e~FtdL (t) eFt -f dFt = e~Ft [dL (t) eF' + d*eF'] =
= [e~F'dL (t) - d*e~F'] eFt. (3.38}
Доказательство. Из (3.36) имеем
еД1;+дfl _ е 9 ^Fie^Li [i _|_ 0 (Д)] е 2 AF\
Поэтому из равенства
exp {e~F' (ALc + АД) eF'} = e~FieALt+AFieF<¦
получаем
eAL'- = e~F& ^Fi eALi [ 1 + о (A)] /i+ ^ =
= e F''eALi [1 + о (A)] etl+l.
Произведение подобных операторов, следовательно, можно записать
eAL* ... 1 = e~~FiteALi [ 1 -Д о (A)] eAL* ...
... eALA'~l [1 + о (A)] etN.
Учитывая (3.35), отсюда имеем
eALi _ _ _ eALA'-i = e~Ft> e^LigbLz ... eALN~^etN +
+ е(Ж)Х{[1 + 0(Д)р_1};
т. e.
limeALl ... eALN~l = e~F*T (3.39)
д-"о
Полагая s = ti, t = ti+\ в (3.37) и в (3.39), получаем в результате
сравнения этих равенств
eAL' = е F'4 t etl+x [/ -f о (А)]. (3.40)
i *-1-1
Следовательно,
т. е. операторы L'(t) действительно служат для полугруппы Т st
производящими операторами. В соответствии с теоремой 3.2 (3.2.В) имеем
также
lim [In T'tlU + ... + In T'tN_xtN) g = [L' (t) - L' (s)] g,
A-"0
gtDL.
Перейдем к доказательству (3.38). Эквивалентность всех трех равенств
(3.38) следует из (3.29) (при R = F). Согласно определению интеграла
(3.28) первое равенство (3.38) означает
lim У (еА1г -/) f (ti+1) = lim У [e~F^ д->о ^ д-"о ^
I I
{e^i _ /) eVi+ (eAF' - (3.41)
Примем во внимание, что в соответствии с (3.40), (3.27)
e&L' = е FtieALiе [I о (А)]. eAL' - I = [e~F'i (e*L'- /) /"+i + eAC _ /]
[/ + 0 (Д)], откуда следует (3.41). Доказательство закончено.
§ 3.3. ПЕРЕХОД К СПЕЦИАЛЬНОМУ СЛУЧАЮ
1. Пусть операторы L(t), L* (t) имеют следующий специальный вид:
L(t) - L (s) = j 1А(у(т), г) dr -f Ар (у (г), r)dyp(r)]; (3.42)
S
L* (t) - L* (s) = j [dt M (г/ (t), t) + d*y0 (t) *Д (у (т), т)] (3.43)
S
Здесь при фиксированных г€ Г и у ={ г/ь ..., yt] ?Ri операторы А, А р
представляют собой линейные операторы на DL, а *Л, *А9 - операторы на
DL*. Функции {yi(t),..., yi(t) } являются компонентами диффузионного
процесса с параметрами а р (у, t), bta(y, t), р, о=1,..., I.
Стохастические интегралы (3.42), (3.43) понимаются в смысле, описанном в
гл. 2 после того, как операторы подействовали на функцию g*•

Предыдущая << 1 .. 12 13 14 15 16 17 < 18 > 19 20 21 22 23 24 .. 97 >> Следующая