Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 25

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 19 20 21 22 23 24 < 25 > 26 27 28 29 30 31 .. 97 >> Следующая

*jH-i) = Л* (?. ^+i)e°(A2)-
(4.23)
Если взять теперь не совпадающие, но близкие значения 2* и г*, то из
(4.22) в силу дифференцируемости по zk параметров аР', bfa' будем иметь
0Zft (v> h+i) = (у> **+i) ехР 10 (гк - гк) А + О (А2)].
Следовательно, при zh-z* = o( 1) имеем (r)zk(P, tk+1) =(r)7k(v,tk+1)e°<b)-,
p2k(Z,tk+1)=~p7k(t,tk+i)e°<A).
(4.24)
Перейдем теперь к рассмотрению многомерных распределений, входящих в
(4.19). Согласно уравнению (4.16) компоненты z' (•) = {Zp'} однозначно
определяют прочие компоненты z" {•) = {2р'}. То же самое справедливо и
для .приближен-
85
ного процесса (4.18), причем Iirri2p-*2p, т. е. г"-г?=о(1).
д-о
Запишем (4.19) в виде
1
/ (г (•))
[Рго (г1 ~ го) • • • pzN_x (Z;V - zA'-l) 1 г1= г1 - • • ¦ -глг-1 ^ Z N- J
р~ (I"; - Т0) . . . P7n_x &'N-~N-1)
и внесем знаменатель в правой части под знак математического ожидания.
Учитывая при этом (4.24), получаем
N-1
, Е о.(Д)
ГИО) ' ^Z(s)
что завершает доказательство.
Очевидно, что вышеприведенная лемма справедлива и для пополненной
последовательности ст-алгебр
§ 4.3. ПРОИЗВОДНАЯ РАДОНА-НИКОДИМА ДЛЯ ДИФФУЗИОННОГО ПРОЦЕССА
В настоящей главе мы будем рассматривать диффузионную марковскую систему
мер в я-мерном эвклидовом пространстве Rn, но более частного вида, нежели
меры, определяемые операторами (3.42), (3.65). Именно/'не вводя
дополнительного диффузионного процесса {y(t)\, будем полагать
dL = (с + ар + у бро dz^dz^) dt¦ (4-25^
По сравнению с (3.42), (3.65) здесь изменено обозначение: х заменено на
г, т на я и положено A 0. Функции с, а9, Ь9а предполагаются непрерывными
функциями от z\,...,zn, t и (если нужно для перехода от одного
стохастического интеграла к другому) дифференцируемыми по zu ...,zn.
Как указывалось в предыдущем параграфе, данная система мер определяет
меры (xz(S) в функциональном пространстве {Rn, >г), RTn=RnX...X Rn, а
также на других, менее широких ст-алгебрах.
Кроме данной меры р введем другую меру v аналогичного же типа и
рассмотрим вопрос об абсолютной непрерывности этих мер на (Rn, <№")¦
Если матрица локальных дисперсий \\bta\\ невырождена, то, как известно
(это следует из леммы 2.1) для абсолютной непрерывности мер pZ(s) и vz(S)
на , необходимо и достаточно, чтобы матрицы локальных дисперсий обоих мер
совпада-
86
ли на всем интервале [5, и]. Параметры сноса а9 обоих процессов могут
быть различными.
Положение осложняется для вырожденных матриц локальных дисперсий.
Совпадение матриц локальных дисперсий в этом случае недостаточно для
абсолютной непрерывности. Как видно из (4.17), необходимо также
совпадение выражений (4.17) для обоих процессов во всех внутренних точках
рассматриваемого интервала.
В нижеследующей теореме мы возьмем в качестве меры •vZ(s) из всех мер,
абсолютно непрерывных относительно заданной, такую меру, которая в
некотором смысле является простейшей. Именно, пусть она имеет наименьшее
необходимое число отличных от нуля членов в соответствующем ей выражении
аналогичном (4.25). Поскольку должно выполняться равенство
то, очевидно, нельзя положить а9 =0, но можно положить
Теорема 4.1. Пусть мера pZ(s) в пространстве Ет определяется
инфинитезимальньш оператором (4.25), ,а мера ¦Vz(s) - оператором
Тогда эти меры абсолютно непрерывны на о-алгебре или причем производная
Радона-Никодима имеет вид
если выполнены условия существования этого стохастического интеграла.
мах 4.2, 4.4.
Утверждение теоремы, если не говорить о членах с с, содержится в
результатах работы Гирсанова [1] и др. Тем не менее мы приведем здесь
краткое доказательство, чтобы
dly = ( cv + а.
,v д I _L bv д2
'р V 2 Р° dze dza
ар- = 0; ар- = ар Vx' bx-li' ax. (4.26a)
(4.27)
Смысл обозначений p', o', b9.)a., такой же, что и в лем-
87
проиллюстрировать метод доказательства, применяемый в дальнейшем (§ 4.4)
для получения более сложных результатов.
Будет использована
Лемма 4. 6. Пусть имеется последовательность расширяющихся о-алгебр ,
сходящаяся к &г, и две меры р и v на &г. Тогда, если эти меры абсолютно
непрерывны на каждой Эгп и производная Радона-Никодима fn сходится почти
всюду к конечной и почти нигде не равной нулю функции f, то меры р, v
абсолютно непрерывны на PF и производная Радона-Никодима равна f.
Эта лемма относится к основаниям теории меры и мы не будем
останавливаться на ее доказательстве.
Доказательство теоремы 4.1. Рассмотрим меру pz (Sj > соответствующую
инфинитезимальному оператору
А1 / д , 1 и д2
d,L = ар ---------bfa -5-з-.
р *р ^ 2 * дгр дга
т. е. диффузионному процессу с параметрами а(, Ь9а. К этому процессу
относится лемма 4.4 и для него справедливы стохастические уравнения
(4.14) - (4.16). Приближенно эти уравнения можно заменить на
конечноразностные уравнения и воспользоваться леммой 4.5.
Пусть S\ - {^} есть А-разбиение интервала [s, и]. Предел S" = lim будет
множеством сепарабельности, поэтому JV°su =
Д-+0 Р s
Если доказать, что меры pz<S), Pz(s), vz(s) абсолютно непрерывны на
причем производная Радона-Никодима
Предыдущая << 1 .. 19 20 21 22 23 24 < 25 > 26 27 28 29 30 31 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed