Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 15

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 9 10 11 12 13 14 < 15 > 16 17 18 19 20 21 .. 97 >> Следующая

имеет вид
47
Введем для данной марковской системы мер однопараметрическое семейство
операторов L* (t), t?T (определенное с точностью до постоянного
аддитивного оператора).
Определение 3.1. Семейство операторов L*(u)-L*(s), ">s задается
предельным переходом
[L* (и) - V (s)] g = lim [Ttlt, -/+... + TtN_btN - I] g, (3.1)
Д-*0
где t\,tN есть А-разбиение интервала [s, u)\ I - единичный оператор.
Пространство функций DL*(ZG, для которых сходимость (3.1) имеет место и
пределы не зависят от специального способа разбиения, является областью
определения указанного семейства операторов (предполагается, что Dl* не
зависит от s и и).
Нетрудно показать, что в случае однородной марковской системы мер (в
случае однопараметрической полугруппы) вышеприведенные операторы
соотношением
U (и) - L* (s) - (и - s) А
связаны с инфинитезимальным оператором А, определяемым обычным способом,
и что Dl*-Da.
Приведем без доказательства ряд утверждений, касающихся введенных
операторов.
Пусть при любой gCGodG функция f(t)=Ttug принадлежит области Dl*- Тогда
она как функция от t удовлетворяет интегральному уравнению
f{t)-g = ld'L'(T)f{x), t<u. (3.2)
t
Здесь интеграл понимается в смысле предела (см. § 2.1)
и
Аналогичное уравнение имеет место для меры ср€Ф:
Ф(1)-Ф= |'ф(т)(1Т(т), s<t, (3.3)
где интеграл имеет следующий смысл:
Опуская g и ф, подобные уравнения можно писать также непосредственно для
операторов Tsu. При этом возможны несколько интегральных форм записи,
например
Тъа = I + j Тя <CU (т) = Tst + J Tsx d'L* (т);
<3-4)
Tsu - / + j' d'L' (т) Тти = Ttu + j d*L* (t) Txu
(s<t<u), а также дифференциальные формы записи:
dJsu = Tsu d'V ("); ds7su = (S) 7SU. (3.5)
Итак, полугруппа Tsu определяет семейство производящих операторов. При
помощи последних записываются интегральные или дифференциальные
уравнения, которым удовлетворяют полугрупповые преобразования.
Справедливо и обратное утверждение: семейство производящих операторов
определяет полугруппу. Если задано семейство операторов L(t), то можно
записать дифференциальное или интегральное уравнение, например (3.2). Его
решение f(t) можно интерпретировать как результат некоего преобразования
Ttu функции g в функцию /(/). Докажем, что подобные преобразования
образуют полугруппу. Кроме (3.2) рассмотрим второе уравнение
f(s)-f(t)= jVL'(T)/(T), s<t.
S
Первое из них (3.2) определяет /(/) как результат преобразования Ttug, а
второе определяет f(s) как результат преобразования Tstf(t). Складывая
эти два уравнения, получаем уравнение
f(s) - g= ^d*L*(x)f(x),
S
которое определяет f{s) как Tsug. Поскольку в этих уравнениях f(s) есть
одна и та же функция, имеем
TJtu§ = Tsug-
Тем самым полугрупповое свойство доказано.
Отыскивая для этой полугруппы операторы L*(u)-L*(s) по формуле (3.1), мы
придем к исходным операторам.
Семейство операторов L* (t) будем называть производящим, поскольку оно
определяет полугруппу. Будем употреб-
49
лять также термин инфинитезимальный оператор для соответствующего
дифференциала dL* (t).
Теория операторов (3.1) призвана обобщить существующую теорию однородной
полугруппы. Для последней полугруппы теория упрощается и уравнения (3.2)
обращаются в известные уравнения (Дыикин [3], стр. 48).
Помимо обобщения на неоднородный случай для дальнейшего необходимо еще
одно обобщение - обобщение на тот случай, когда система мер \ist{x,A. )
является случайной, т. е. зависит от точки со€й некоторого вероятностного
пространства (й, о4С, Р). При этом все условия и утверждения теории нужно
формулировать (в отличие от теории неслучайных мер ps<) как выполняющиеся
с вероятностью единица или в среднем. Из последующей теоремы 3.1 видно,
что предел (3.1) удобно понимать в среднем (/. i. т). Соответствующие
уточнения довольно стандартны, и мы не будем каждый раз их оговаривать в
дальнейшем.
2. Утверждения, высказанные в предыдущем пункте, удобно
проиллюстрировать и обосновать на следующем примере.
Пусть Е является конечным множеством из т точек. Тогда функциональное
пространство G будет совпадать с m-мерным вещественным пространством Rm,
элементами g которого являются вектора: g= (gi,..., gm). В G можно
определить норму
||g|| = max (ft, ¦ ...ft,).
Операторы в этом пространстве являются mXm-матрицами.
Возьмем семейство производящих операторов диффузионного вида
Е* (0"э = j [Л"р {у, х) dx + Ахро (у, т) d*ya (т)], (3.6)
аналогичных (2.35а). Здесь y={y<s{t), о=1, 2, ...}-диффузионные процессы
с параметрами аа (у, t), ba?(y, t): Функции Ахр, аа> предполагаются
ограниченными и непрерыв-
ными. Функции Дхрт удобно считать дифференцируемыми по у?-
Уравнение (3.2) при этом имеет вид системы стохастических уравнений
U U
/а (0 - ga = f Аар (т) /р (т) dt + j Аара (т) d*ya (t) /р (т),
t t
или
и и
Га (/) - ga = f *Ла0 (х) /р (т) dx + f d*ya (т) Аа ра (т) /р (t)
t t
(а = 1, ..., М),
50
согласно формуле (2.15), примененной к интегралу (3.6).
Как доказывается в теории стохастических уравнений, указанные уравнения
Предыдущая << 1 .. 9 10 11 12 13 14 < 15 > 16 17 18 19 20 21 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed