Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 7

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 2 3 4 5 6 < 7 > 8 9 10 11 12 13 .. 97 >> Следующая

|' dx' j" ф (т' - x") dx" = | dx' J ф (t) dx = J (i - т) ф (т) dx,
о (
получаем

s' - S ,f у -
X X
x
i, i
s-s
/'+-+y
dx{ ... dx rc
i
(t =
kr^ (T, JTj, . , . , Itr^-2)
¦t", it- = x" X
(1.31)
dnt ... ditp 2*
Согласно (1.15) это выражение стремится к конечному пределу при р^О.
Среди сомножителей ITS*, как отмечалось ранее, заведомо имеется хотя бы
один "смешанный" сомножитель. Среди его аргументов имеется и>0 аргументов
из группы оь ..., ат и г{- -и>0 аргументов из от+1, ..., от+". Для такого
сомножителя после замены переменных тj = p2a3- будем иметь
В 2 г1/? И-2 *Р-Н
У-Я-1
IX-2 tp
дх,+...+чГ[
дхУ" . .. длРД ^ (xi>Ti> • • - .А.,у.)
1 У
X
X
или,
ц если обозначить L = р~2 шах (tp, tp+l - tp) = p"2L0 и использовать
свойство стационарности,
19
-L О
Si < ^ I ¦ ¦ II¦ • ¦ 11L....kri {Xv Ti' • ¦ ¦,*r',Tr')
dx^1 .
X
Пусть
тогда
X dx1 . . . dxr.. x' = шах (xlt ... ,xu); x" = min (tu+Ii ... , тг),
si<2^ JrfT'{••• JrfTi'
-L -L
0 x"
dV,+...
dx\* ...
0 x'
< ^ |/' j dx' J. . . j* dx\
kr dx\ ... dxr_u_x <
x'-L
x"+L
. . . dx
dx] ... . (1.32)
Здесь сумма содержит и (rt - и) членов, соответствующих
областям х' = xjt х" = xk\ j - 1, ... , и\ k = и + 1 rt.
Легко видеть, что для всякой интегрируемой неотрицательной функции ср(т\
т") справедливо неравенство
О L 2 L X
( dx' f ф (т\ х") dx" < f dx J ф (т" - т, x") dx", (1.33)
-LO 0 0
поскольку справа область интегрирования шире. В нашем случае
x" + L
Ф (х', т") = j ... J dx\ ... dx'u__x j... j
x'-L
¦kr Лx', x' ...
¦ • ' Xu~1> X ' Xl' • • • ' Xr.-и-l)
dx". ... dx' ,
1 Г ¦-U-1
Л Л ' 1
. . . , X' - lu-1, x", x" + Jt:.............x" + JT,._"_i)
dit^ ... -n-i.
20
Эта функция зависит лишь от разности т"-т'=т, поэтому интегрирование по
т" в правой части (1.33) сводится к умножению на'т. Применяя (1.33) к
(1.32), имеем
Вследствие (1.16) это выражение стремится к нулю приА->со,
Итак, среди сомножителей ILSj есть хотя бы один, стремящийся к нулю при
ц.-*0, в то время как остальные стремятся по меньшей мере к ограниченным
пределам. Это доказывает стремление к нулю каждого члена суммы (1.28) и,
следовательно, всей суммы. Поэтому семиинвариант (1.26) стремится к нулю.
Тем самым оказывается выполненным условие (1.20) леммы 1.1. Применение
этой леммы доказывает, что распределение случайных величин (1.23) вполне
сходится к такому распределению, в котором величина = /*р+1 (у)
оказывается независимой от остальных.
2) До сих пор значение у в х (/) = ft (у), t > tp у нас было
независимой переменной. Между тем, если мы интересуемся непрерывной
траекторией х (t) - f о (х0), следует распорядиться этим значением так,
чтобы у = f0p (х0).
Пусть точки {Па} образуют А-разбиение интервала / и пусть /Л (у = [П,бр)
, Ya%)+1] есть тот из элементарных интервалов,
который содержит точку = / ор(*о).
Очевидно, что функция, совпадающая с f* (х0) при t < tp
и с // {Ya(| )) при t^>tp, имеет единственный разрыв в точке t , по
величине не превосходящий А. В процессе предельного перехода А -> 0 эта
функция будет с вероятностью 1 стремиться
к непрерывной функции л: (/)=/<( (х0), ^</р+ь Поэтому
Р{Л,7^ЧУ <гр+1\1Ч1р)} = Р{Л, Ttpp+X (Уа(1р)) <гр+1|/А(у} +0(1) п. н.
(1.34)
L
о о
. . , - ?и-г, т, т -j- n1; . . . , т + яг.-и~i) dt,j . ..
• • • dZ,u-idzt^ . .. dztr^-u-i.
Здесь
Л = {со : < zlt ... , < z^},
, Zp_x, гр\л - действительные числа.
21
Рассмотрим условную вероятность
Русл (у) = Р {Л, /?н (1р) < гр+1 \гр = у} =
- lim Р {Л, J\Pp^(lp)<zp+l\I^ (у)},
¦ Д-"0
которая в силу (1.34) равна
Русл (У) = limР {Л, Ttp+l {Yа{у)) <ZP+1\IA (г/)}. (1.35)
Д-И)
Введем функцию
Д(?р> У) = lim w---р+1' (1.36)
P{A,/A(ep)J^+1 (^/) < zp-\-\)
... i/1-11111 7----------
р А^о р {/А (gp)}
Там, где знаменатель обращается в нуль, ее можно доопределить
произвольно, например, положить равной нулю.
Используя 1. А2 и условия 2) - 3) теоремы 1.1, можно доказать, что при
любых Л, zp вероятность Р {Л, < zp,
f\p+l (у) < zp+1 {непрерывно зависит от у. Отсюда вытекает, что функция
(1.36) с вероятностью 1 непрерывна по у.
Поскольку
Р {Л, TtPo+l (Ya(y)) < Zp+I I /А (у)} =
Jn(Ep, Ya(y))P(dlp),
Р{/Л(И)
/Л(У)
то из (1.35), учитывая указанную непрерывность функции л по второму
аргументу, получаем
Русл (У) = л(у,у) п. н. (1.37)
Рассмотрим теперь предельный переход р -н> 0, пользуясь леммой 1.1 (при
?р_1_1 = f\p+l (у)). Поскольку согласно этой лемме
Р{Л, lp<zp, ?p+i < zp+\\ -~*F1(z1, , zp)F2(zP+ i),
то
Л(1р, у) = Р {Л, lp^<Zp^\lp) - -
Fi (^у, ..." Zp-у J ^р) F<i (Zp^_])
п. н. при р -^ 0. Здесь F2 (zp+\) = F2 (zp+\ ] у), поэтому условная
вероятность (1.37) в пределе распадается на произведение
Р {Л, 1с (tp+x) < zp+i 11р = у) Fx (zv ... , Zp-11 y) F2 (Zp+11 y) и,
следовательно,
22
вгт.
Р {х {tp+1) <С. Zpy 1 I X {ty) = Zy, ... , x (tp) = zp)
F2 (zp+i I zp) • (1.38)
Это завершает доказательство утверждения 1.1.А теоремы. Многомерная
вероятность
Р Йty) <Zy, ... ,1с (tn) < zn] = f ... f dP [l(ty) < z\] x
Предыдущая << 1 .. 2 3 4 5 6 < 7 > 8 9 10 11 12 13 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed