Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 24

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 18 19 20 21 22 23 < 24 > 25 26 27 28 29 30 .. 97 >> Следующая

dV°T однозначно определяет меру на а-алгеб-рах (например, Лоэв [1],
стр. 529). В дальнейшем
мы ограничимся рассмотрением сепарабельных процессов (относительно 8 ).
Для них существует счетное множество S (множество сепарабельности) такое,
что множество
(г(.):г(/)(Л,/(Г}(о"г
отличается от
{г(.):г(/)(Л,
самое большее на подмножество множества ГД oMf меры нуль.
Таким образом, если пополнить а-алгебру под"
множествами нулевой р^-меры из Мтр и соответствующую пополненную а-
алгебру обозначить jq будем иметь
В соответствии с этим для сепарабельных процессов наиболее широкой а-
алгеброй можно считать а-алгебру <^Vs-Пространство с мерой (?t,"^(r)ts,
pZ(s)) можно выбрать за исходное. При таком подходе процесс z(-) по
терминологии Дуба ([1], стр. 67) является непосредственно заданным
процессом.
82
Другой подход, как известно, заключается в том, что рассматривается
абстрактное измеримое пространство (Q, ),
а .процесс z(-)=z(-, со) вводится как сШ-измеримая функция на нем. При
этом нужно постулировать, что прообразы всех описанных выше о-алгебр
содержатся в <Ш. Все утверждения относительно о-алгебр и др. в Ет, как
правило,
можно перенести на их прообразы в Q. Мы на этом не будем останавливаться
и не будем вводить специальных обозначений для о-алгебр в П, обозначая
их, если понадобится, теми же буквами.
В том частном случае, когда Т есть интервал [а, [3], будем употреблять
обозначение ^[а.р] =^а и аналогично для других о-алгебр.
2. Рассмотрим диффузионный процесс z(-) =у(-), определяемый уравнением
(4.14). В этом случае мера pZ(s) является вероятностной и при любых s и
z(s) она сосредоточена на множестве непрерывных функций. Множеству
остальных функций можно приписать меру нуль (или с самого начала
рассматривать только множество непрерывных функций). Тогда процесс будет
сепарабельным, причем множеством сепарабельности S будет любое всюду
плотное в Т множество. (В пространстве непрерывных функций о-алгебры <№т
и Мт будут попросту совпадать.)
Если винеровские процессы %'{t) в (4.14) считать <Ш -измеримыми функциями
от co?Q, то интегральное уравнение
(4.14), как известно, определяет процесс "/(•) = {*/(/,со)} как -
измеримую со-функцию.
В дальнейшем для получения различных результатов мы
будем рассматривать Д-разбиение 5д ={fi, ..., tN } интервала
[s, /]€7\ При этом подразумевается, что 5дС15л' при Д'<Д.
Будет использоваться то обстоятельство, что предельное
множество =11гп5д является множеством сепарабельности д-*о
и, следовательно,
Наряду с точным уравнением (4.14) иногда полезно рассматривать
соответствующее уравнение в конечных разностях
~ А-1 ^
Zp* - Zp (s) = ^ \af &t, tt) (ti+1 - /,¦) +
i=0
+ V- Й. О [g* (/i+1) - br (/,.)]}. (4.18)
(Zfi = Zp (/;), tQ=S).
Получающийся при этом приближенный процесс {z(ti), ... ..., z(tN} в
некотором смысле близок к точному процессу
83
z(-) и соответствующая ему мера рд3) на близка к мере pi2(s).
Сформулируем соответствующее утверждение в виде леммы, которая нам
пригодится в дальнейшем.
Будем предполагать, что на всем интервале [s, t] ранг V матрицы []?"
рСТ|| не изменяется и не нарушается линейная независимость ее V первых
строк. Тогда вместо всех компонентов процесса г(-) можно рассматривать V
первых его компонентов г(-)= {Zp<0), р'=1, }. cr-алгебры в
пространстве
Ет, соответствующие этим компонентам, будем отмечать штрихом.
Лемма 4.5. Мера jtZ(S) точного процесса и мера pZ(S) приближенного
процесса (4.18) абсолютно непрерывны на а-ал-гебре причем производная
Радона-Никодима
стремится к 1 при Д-"0 почти всюду относительно pZ(S).
соответствующие одному элементарному интервалу [tk, ^+1]. Мера pZk
(dzk+i), как видно из (4.18), соответствует гауссовому распределению для
разности ?р< = zr,k+\ - zp>tk со средним значением a.-{zk,tk) (tk+1 - tk)
и матрицей дисперсий br<,-(zk,tk) X X (^+i - tk). Мера pZk (dzk+i) имеет
плотность распределения pZk (u, i) = p, которая удовлетворяет
диффузионному уравнению
Приближенное решение этого уравнения при малых t-Д удобно находить при
помощи преобразования Фурье, т. е. рассматривая характеристическую
функцию
Диффузионное уравнение эквивалентно следующему уравнению для нее:
(4.19)
pZ(S) (dz\ ... dzN)
Доказательство. Сравним меры \iz (dzk+1) и \iZk(dZk+\),
SZk (v,t) = &= ^eiv^' pZk{l,t)dl.
i- vP'Va' bra-(zk - i ^j(c) (4.20)
((r)zk{v,tk) = 1).
.84
где введено обозначение операторов
/(-i-'(c) = - f el^f(l)dl Г1^е-- Q(u)du. (4.21) \ у 2я J J
iu.
- 00 -00
Функции аР-, Vo', 0, по нашему предположению, таковы, что соответствующие
интегралы в (4.21) сходятся.
Уравнение (4.20) будем решать методом последовательных приближений: 0" =
evn;
дфп _ е-ч>п-1
Wo
(г'"гдл')"
Это приводит к результату 0 (и, t) = exp
vr va¦ bP-a, (zk, tk)
iVf-a,- (zk,tk) -
Но характеристическая функция
1
exp
i Up' ap uP' v0' Vo'j V - ^*)| ^ (r)-
при t - tk+1 в точности соответствует мере [i2/, (dzk-pi). Из равенства
0(п, ф+j) - 0(и, 4+1)е0(Лг) имеем
Предыдущая << 1 .. 18 19 20 21 22 23 < 24 > 25 26 27 28 29 30 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed