Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 43

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 37 38 39 40 41 42 < 43 > 44 45 46 47 48 49 .. 97 >> Следующая

результатов. Именно, найдем апостериорную статистику приращений Аха=ха
(t-\-A)-xa(t), рассмотренную в § 3.4. Подставляя выражения."(7.15) в
(3.75) и (3.77), получаем для данного случая
Мр [Аха \ xt, у^ ] - яа (zt, t) A -\-bap> (zit t) X X dp'a' (Ау^ й0> А) -
f- d/p- dp-я' ^Уп'г ' -^-Ьл'Х'А'\ X
Х-а(^'Ц +0(A3d);
dzi
(7.21)
Мр \Аха Ах^ | Xt, Уа ] - dap A -j- dap' (dp'jt' А Ун/ А г/х' Ьх'о'
а также
-d^'A)da'p + 0(A3/2);
Vt^ {xt, Rm) = 1 -j- ap' (z^, ^) dp^' Лг/а' -f- cA -f-
В заключении параграфа отметим, что специальная проверка показывает
инвариантный характер найденных выражений относительно преобразований
вида
х' = х'(х,у); у' = у.
Потребность в таких преобразованиях может появиться при рассмотрении
практических задач. Однако мы не будем приводить выкладок, подтверждающих
эту инвариантность.
§ 7.2. НЕКОТОРЫЕ ОБОБЩЕНИЯ
Результаты предыдущего параграфа были .получены при одном существенном
ограничении. Именно, предполагалось, что Ь?а, ар- - Ь?"Х' Ь^'1п- ал. не
зависят от ха. В настоящем параграфе мы укажем пути решения задачи в
более общем случае, когда это предположение не выполняется. Оказывается,
что для решения более общей задачи не требуется вывода новых формул и
выражений, а достаточно расширить (добавить новые компоненты) исходный
марковский процесс и наблюдаемый процесс.
Вместе с тем мы проведем здесь другое менее существенное обобщение: будем
предполагать, что наблюдаются не компоненты исходного марковского
процесса, а некоторые функции, определенные в его фазовом пространстве.
Трудности, связанные с указанными обобщениями, преодолеваются путем
увеличения числа фактически наблюдаемых функций. В ходе наблюдения в
общем случае наблюдатель с достоверностью узнает не только наблюдаемые
функции, указанные в условии задачи, но и их локальные дисперсии (а также
локальные дисперсии этих дисперсий и т. д.). Поэтому число фактически
наблюдаемых функций оказывается больше, чем первоначально указано. В §
6.2 уже отмечалось, что, в дополнение к процессу {y{t)}, можно считать
наблюдаемыми также функции (6.17) . Их можно включить в число наблюдаемых
компонент. При таком увеличении числа наблюдаемых функций сильно помогает
то обстоятельство, что основные формулы нечувствительны к вырождению
матрицы локальных дисперсий, так что любое число функций можно
присоединить к исходному процессу, рассматривая их как компоненты!
совокупного диффузионного процесса. Этим окупаются усилия, затраченные
ранее в гл. 4 на рассмотрение случая вырожденной матрицы! локальных
дисперсий.
Пусть г= {га, а=1,..., т} -диффузионный процесс в Rm, и пусть заданы
наблюдаемые функции
' У? =F?(z,t), р = 1(7.22)
148
Эти функции, а также параметры исходного процесса мы предполагаем
дифференцируемыми достаточно большое число раз. Процесс {zaf и процесс
{Ур } можно объединить в единый диффузионный марковский процесс,
определенный в Rm+i. Найдем параметры этого единого процесса. Нетрудно
понять, что матрица локальных дисперсий будет иметь вид
где
Ьаа \
Ьра )
Ьра ~
dFP dFa dF?
Ьр(У = ~дГГ ~Ш7 Ьуё' Ьра = Ьар = ~~д^Г bafi'
v в
Далее, вектор сноса будет (аа, ар), где
dfr dFp , d"F,
Параметр с (если его нужно рассматривать) остается без изменения. После
описанного объединения процессов za и Ур данная задача свелась к задаче,
рассмотренной в предыдущем параграфе (при очевидной замене Ха на г0 п на
m + i и т. п.).
Выделяя из || ЬРа || невырожденную подматрицу HVo'l1, будем рассматривать
(/ - /') - компонентный подвектор g?" - ay-
р'Ьр'& etc.
Для применения результатов § 7.1 нужно проверить условие независимости
функций Ьра (г, t), ay (z, t) -
¦-6p"p-(z, t)b J'l- (z, t)a<,- (z, t) от z. Если оно не выполнено,
следует провести дальнейшее расширение процесса {za, Ур}, присоединив к
его компонентам те из указанных функций, которые зависят от г. Обозначим
такие функции Fj(z, t), р = /+/(/<72+/-I'). Как отмечалось, функции F~
можно присоединить к числу наблюдаемых функций (7.22), считая, что
наблюдаются также процессы
У~? = Fy (?>*)¦ ' (7.23)
Подобно тому, как раньше мы пополнили процесс {za} компонентами {Ур},
пополним теперь его компонентами {У?> У7} • Для процесса {га, Ур, У~}
снова проверим условие независимости (теперь уже новых) параметров gy от
z. Если раньше, скажем, функция b9l0l (z, t) зависела от z, то теперь она
превратилась в у~ и тем самым потеряла явную зависимость от г. В случае,
если нее требуемые параметры зависят только от {yf, у~, t}, к задаче
можно
149
применять результаты § 7.1, если нет, то следует произвести дальнейшее
пополнение наблюдаемого процесса {у9, г/~} и основного марковского
процесса.
Очевидно, что описанный процесс пополнения или закончится (и тогда мы
будем иметь конечный наблюдаемый и основной процесс), или не закончится
(тогда будем иметь счетный наблюдаемый и счетный основной процесс). В
обоих случаях апостериорная мера будет сосредоточена на допустимом
множестве
{z(-):Fp(z(t),t)^y? (t), F~(z(t), t) =э г/~ (t), .. .},
Предыдущая << 1 .. 37 38 39 40 41 42 < 43 > 44 45 46 47 48 49 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed