booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 30

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf

Предыдущая << 1 .. 24 25 26 27 28 29 < 30 > 31 32 33 34 35 36 .. 97 >> Следующая

влечет за собой абсолютную непрерывность мер
Р (As | zs) ~ Р (As | ysr), (5.18)
и наоборот, причем производные Радона-Никодима совпа-
дают.
Доказательство. Используя (5.17) и подставляя
(5.7) в равенство
Р (I'sAs j ijr) = j Р (Г51 ijr) Р (dyl | уr),
получаем по теореме Фубини
Р (Гi tfi) = | [ f hU (zs) P (dzs |у*)} P (dyl | ysr) =
А* У s
= J [j his (zs) P (dyl \уЩ P (dzs I ysr). (5.19)
В то же время справедливо равенство
которое в силу условия Маркова можно записать
Р (Г5Л* I у*,) = \ р (As I zs) Р (dzs I yl). (5.20)
П
При сопоставлении (5.19) и (5.20) зафиксируем , а Г5 пусть пробегает
различные множества из 2>s.
При этом будем иметь
Р (Л( \zs) = j/i's(zs) P(dt/S\yl) п. н. (5.21)
а'
S
Отсюда следует (5.18) и равенство
hU (zs) = ndy\Us) (5.22)
Р (di/s | ysr)
Для доказательства обратного утверждения теоремы равенства (5.19), (5.21)
нужно рассматривать в обратном порядке. Доказательство закончено.
Подставляя (5.22) в (5.12), получаем
тД гч Р(^[г,)Р(П|^,^) P(dy{Vt\zs)
Vrs (Zs, rt) = ----------------------=----------. (0.23)
P (dy\\ySr) P(rf^l^)
Таким образом, Vis (zs, Г,) можно рассматривать как производную Радона -
Никодима мер P(A(r,|zJ, Р(Л(|г/)) на ст-алгеб-ре У\. Информационная
непрерывность (определение 5.2) приводит к абсолютной непрерывности этих
мер.
Теорема 5.6. В случае процессов с информационной непрерывностью отношение
hfrs (г^)
his (zs)
yst т гг
r < s <Д; r' < s (5.24)
(здесь для определенности r<r') является Уr-измеримой функцией (т. е. не
зависит от zs).
Доказательство. Из определения 5.2 и леммы 5.1 вытекает абсолютная
непрерывность
P(A(|zs)~P(A(|^);
Р (As 12J ~ Р (As | Ун), Alt У1, и, следовательно,
Взяв отношение двух выражений типа (5.22), получаем
(5.24), причем оказывается, что
р
Р \ ysr) '
Доказательство закончено.
Согласно (5.12) следствием теоремы 5.6 является формула
Vi-* (zs, Г,) = g*. Vis (zs, Г,), r<r'<s<t. (5.25)
§ 5.3. ВВЕДЕНИЕ ОСНОВНОЙ АПОСТЕРИОРНОЙ МЕРЫ
Как видно из сравнения (5.11) и (5.13), мера Vls (zs, Г() имеет перед Wt
(zs, Гг) то преимущество, что удовлетворяет более простому уравнению, не
содержащему никаких других функций. Правда, она имеет перед Wl (zs, Г()
тот недостаток, что не является /^-измеримой, так как зависит еще от уг.
Из формулы (5.25) видно, однако, что эта зависимость носит не очень
существенный характер. Именно, при изменении г мера VrS (zs, Г<)
умножается на постоянную, т. е. не зависящую от zs и Г# (но зависящую от
ysr ) величину. Желательным является вовсе устранить произвол в выборе г
и зависимость меры от уг.
Возникает вопрос, можно ли ввести такую меру (обозначим ее Vs (zs, Tt),
которая сочетала бы отмеченные преимущества мер Vis, и не имела бы их
недостатков. Дадим более точное описание свойств этой меры:
1°. Vs(zs, Г,) Ж ^{'измерима;
2°. V\ (zs, Tt) = glsVU (zs, Tf), (5.26)
т. e. отличается от Vis множителем gls, не зависящим от zs и Г(;
3°. удовлетворяет уравнению
VI (zs, Г") = j Vl (zs, dzt) V't (zit TJ, s < t < u. (5.27)
Перечисленные свойства дают дескриптивное определение основной системы
мер Ks(zs, IV).-
Нетрудно видеть, что из (5.26) и равенств (5.15), (5.16) (при учете
(5.13)) немедленно вытекает справедливость аналогичных равенств для
основной меры, а именно:
^ (zs, Г,) = (5.28)
Fs'(zs,Q)
104
. К (zs, г,) = ------- Г Vs (Zj, dzt) Vi (Zt, Q). (5.29)
Vs {zs, Й) J П
Свойство 2° можно считать эквивалентным равенству (5.28).
Приведенные выше свойства 1°-3° определяют систему мер Vs (zs, Г() не
вполне однозначно. В самом деле, если И (zs, Гг) есть мера с указанными
свойствами, то эти свойства, как легко видеть, будет иметь также мера
У;<(г5,Г<) = #М(г!>Г<), (5.30)
где Os - У\ -измеримый мультипликативный функционал,, т. е. семейство
функций, удовлетворяющих уравнению
0" =-- OjO", s / < и.
Если описанная выше основная апостериорная мера существует, то ее,
очевидно, можно получить предельным переходом
H(zs, Г^) = lim GrVU(zs, Г()
Г Т S
при подходящем выборе ^-измеримого множителя Gr.
Приведем здесь один конкретный конструктивный способ введения основной
меры. Рассмотрим А-разбиение 5д = -- {/1,..., tN ) множества Т, такое,
что с уменьшением А множество 5д расширяется и имеет своим пределом (при
А-"0) множество 5, всюду плотное в Т. Образуем ступенчатую функцию
Ф (/) = max {tt: t. </},
(следовательно, <p(/.j) =/.ы). При фиксированном А определим семейство
мер Vl (zs, Гг) следующим образом. Если Д и />д принадлежат одному
интервалу (ti, /j+i], то положим
^ (zs, r^) = Vrj;(s),s(zs, r^).
Если они принадлежат соседним интервалам: ti<^s -С ti+1 < < / < /;+2, то
пусть
Если tt < s < /г+v 2 < / < /г+з, то положим
V, (г" Г,) - j iy+* (г" <fe,.+1) ,,+, <гы Г,).
Используя (5.31), (5.25), (5.13), можно выразить эту меру через
(s),s -
105
И (2S. Г() = ё^?.+1 j ^ (Zs, dz(f+J) Ир(.5),,.+2 (2(ж, rt) =
= g^fi+1VUs(zs,Tt). (5.32)
Для следующего интервала, когда tt-1_3 < t < ^.+4, пусть V* (zs, Гг) = j
(zs, dzv(ft) Иж.ф(<) (гф(0, Гг). Используя (5.32), а также равенство

Предыдущая << 1 .. 24 25 26 27 28 29 < 30 > 31 32 33 34 35 36 .. 97 >> Следующая