Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 26

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 20 21 22 23 24 25 < 26 > 27 28 29 30 31 32 .. 97 >> Следующая

имеет предел при Д->0, то согласно лемме 4.6 отсюда будет следовать
абсолютная непрерывность этих мер на PP>su. Абсолютная непрерывность
pZ(S)"vz<s), очевидно, не нарушится и при пополнении о-алгебры p-
нулевыми множествами.
Таким образом, доказательство теоремы 4.1 сводится к исследованию
производных Радона-Никодима конечных разбиений Sa, к доказательству их
сходимости при Д-"0.
Для разбиения SA меру pz (S> представим в виде
pi(s) (dZi ... dzN) = 7 pz(s) (dzj pZl (dz2) ... p,^ (dzN), (4.28) где
zt=z(tt) и pz.(dzi+1)
гауссова мера со средними значениями zfi + af (zu ti) (ti+l-U) и
дисперсиями bea (zit ti) (ti+i-ti). Согласно изложенному в
88
лемме 4.5, / стремится к 1 л. н. лри Д^О. Нетрудно доказать, что
p,z(s) (dz1 ... dzN) = /А ехр [с (z(s), s) (tx - s) + ... +
-f- с {zn-u tN- 1) (t,v- ^v-i)] p2(s) {dz1 ...dzN), (4.29)
Здесь vz (dzi+1) - гауссова мера со средними значениями: 2Р/+ (2j> (^+1
- ti) (см- (4.26.а)) и дисперсиями
Ьра(гр t.) (ti+1 -1.)\ /v-> 1 п. и. при Д^О.
Учитывая (4.28) - (4.30), получаем, что меры (4.29), (4.30) абсолютно
непрерывны, если абсолютно непрерывны элементарные гауссовы меры
nZ[(dzi+i) и vz {dzi+{). Применение леммы 4.3 позволяет доказать
последнее и найти соответствующую производную
Подставляя (4.28) в (4.29) и поделив (4.29) на (4.30), получаем при учете
(4.31)
Если выполнены условия существования стохастического интеграла, сумма в
(4.32) при Д->0 имеет своим пределом интеграл. Эта сходимость, а также
вышеупомянутая сходимость /л, /, /v к 1 доказывает абсолютную
непрерывность мер на Jy°sa и равенство (4.27).
uz(dz.,) .
= ехр (ар. (г,, t,) brv (i) [zt> (ti+1) - zv (f,.)] -
- ~ar{i)b~^{i)aX'(i) (^+1 - f,)j. (4-31)
vz(s) (dzi
+ ap. (i) brlv (i) \Zv (ti+j) - zv (f,.)] -
- ~ cl9'(i) b~\. (i) (i) (fi+1 -*j) J. (4.32)
§ 4.4. ПРОИЗВОДНАЯ В ФУНКЦИОНАЛЬНОМ ПРОСТРАНСТВЕ ПРИ ЧАСТИЧНОМ УСРЕДНЕНИИ
ДИФФУЗИОННОГО ПРОЦЕССА
Разобьем компоненты Z\, ..., zn рассмотренного ранее диффузионного
процесса на две группы, обозначая
za - ха; а = 1, ... , т; z9 = ур, р = тф1,...,т + 1 = п.
Индексы а, р, . . . здесь и в дальнейшем пробегают значения 1, ... , т, а
индексы р, а, ... - значения т + 1, ... , т + /. Пусть
/' -= Rang П 6ра |1.
Будем, как и в §4.1, употреблять штрихованные индексы, условившись, что
р', а', ... пробегают значения т ф 1, . . . , т + Г, а р", а", ... -
значения т + I' + 1, . . . , т + /. Предполагается, что det |[ йр-о-1| ф
0. Эта система обозначений, которой мы будем придерживаться также в гл.
7, позволяет не указывать каждый раз область пробегаемых значений.
Компоненты \у9) в совокупности образуют точку в /-мерном борелевском
пространстве (Rh<Mi)- Условия типа {//Р(/)^А}, Л ? <Ф>, (/ фиксировано)
выделяют ст-алгебру в пространстве Rn, которую мы будем обозначать Л1.
Кроме того, мы будем употреблять обозначения Лу = <т( U Лф Лу-. Они имеют
смысл,
t?T __
аналогичный смыслу обозначений поясненных в § 4.2.
Марковская мера p-(S) на определяют меру р2(.,) на л1^1, но при этом
существенно, что на Ль (т. е. при фазовом пространстве Ri) мера уже не
обладает марковскими свойствами. Теорема 4.1 к этому случаю будет
неприменима, тем не менее в некотором смысле она допускает обобщение и на
этот случай.
Если взять две абсолютно непрерывные на & меры р, v и их производную
Радона-Никодима f на и рассмотреть интеграл
р /Л) = ^ fdv
' ¦ л
по множеству К^Ла^, то, очевидно, получаем, что указанные меры абсолютно
непрерывны также на Л. Производная Радона-Никодима на Л при этом
получается усреднением первоначальной производной:
/ = Mv [/1 Л], (4.33)
90.
где обозначение Mv [ - ] ^4] соответствует (П. 1.4), (П.1.2):
Mv [/ \Л\ = [v (cfco)]-1 j fdv,
do)
Конечно, в формулу (4.33) можно подставить, скажем,
(4.27) и получить функциональную производную на <Л\. Однако такой
результат еще не очень продуктивный. Чтобы получить более полезные
результаты, мы пойдем по другому пути.
Теорема 4.2. Пусть мера pZ(S) на соответствует диффузионному процессу в
п-мерном пространстве (Rn, <Шп) с инфинитезимальным оператором
dL =
, V4 д 1 VH А
+ > а, -------------------------------> b
71 } дг, ч ¦
д2
/=1
/,*= 1
dzjdzk
dt.
причем 6ра и а?-бр"а- ба4 ал- не зависят от ха гизмеримы).
Тогда мера p.z(s) на ,At абсолютно непрерывна по мере vtf(S) (= ^z(s)),
соответствующей диффузионному процессу в 1-мерном пространстве (Rt, 331)
с инфинитезимальным оператором
dLy
(fl-/ бр"а' ба'я' ^зх')
дУ=
+ Тбр0
д2
дУРдУа
dt.
Производная Радона - Никодима на имеет вид
rs (х (s), у(-)) = = ехр || Мц (с I<Л[) dt +
(4.34)
(s) (dy (•))
+ Мд (аУ I <Л{) d* i/а- (0 -
- Y Мм (ар-1 c^f) бр'а- Мд (аа-1 c^s) dt
Предполагается, что выполнены условия существования этих ¦стохастических
интегралов.
Доказательство. Выбирая Д-разбиение 5д интервала [s, и\ и записывая для
pZ(S) формулы, аналогичные (4.29),
(4.28), имеем
pz(s) {dzx ... dz.v) = /л /efWs)'s>(^-s) X (4.35)
XNs) (dZj) ... ec(N~l) (tN~ *N~l) Ргд,_, (dzN),
где pz. (dz^j) - гауссова мера со средними значениями Zj(tt) + а,- (z
Предыдущая << 1 .. 20 21 22 23 24 25 < 26 > 27 28 29 30 31 32 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed