Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 35

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 29 30 31 32 33 34 < 35 > 36 37 38 39 40 41 .. 97 >> Следующая

тот факт, что эта система мер, определенная в том или ином (может быть,,
обобщенном) смысле, существует во всех без исключения случаях условных
марковских процессов. Для ее существования не являются совершенно
необходимыми предположения типа "информационной непрерывности" или типа
гипотезы 5.1. Правда, в более сложных случаях указанные меры могут иметь
весьма "экзотический" вид, выходящий, возможно, за рамки существующей
теории меры. Для их рассмотрения может потребоваться обобщение обычных
понятий.
Обратимся для примера к формуле (5.7). Когда мера Р(ГД ) не является
абсолютно непрерывной относительно Р(П|рг), нельзя пользоваться теоремой
Радона-Никодима для определения функции (5.7). Однако если включить в
рассмотрение обобщенные функции, то меры Р(Г,|г/"), P(F,sj ysr) будут
определять функцию (5.7) как обобщенную функцию в достаточной степени
однозначно. В обобщенном смысле могут быть определены и другие объекты
теории. Основные утверждения теории, касающиеся соотношения между ними и
вопросов их измеримости, после соответствующего обобщения этих объектов
останутся по-прежнему справедливыми. Конечно, строгое доказательство этих
утверждений сильно усложнится.
Глава 6
СКАЧКООБРАЗНЫЕ изменения
НАБЛЮДАЕМОГО ДИФФУЗИОННОГО ПРОЦЕССА
В настоящей главе будет рассмотрен один из важных частных случаев
условных марковских процессов. Будет предполагаться, что имеется конечное
число т различных диффузионных процессов, между которыми априори возможны
марковские переходы. Наблюдатель имеет в своем распоряжении реализацию
диффузионного процесса, но не знает, к какому из диффузионных процессов
она относится. Таким образом, исходный марковский процесс в данном случае
есть комбинация процесса с т состояниями и диффузионного процесса, а
апостериорный процесс есть процесс с т состояниями. Данная задача
является естественным обобщением известных задач математической
статистики, в которых априорные переходы между состояниями предполагаются
невозможными (см. дополнение).
К числу рассматриваемых здесь задач относится задача оценки марковского
процесса с несколькими состояниями, наблюдаемого в сумме с белым шумом.
Она была решена автором в работах [1, 2]. Взятый в § 6.5 в качестве
примера процесс с двумя состояниями многократно рассматривался автором
[1, 2, 15, 19]. Уравнение этого процесса записывается в двух формах: как
в форме Ито, так и в симметризованной форме. Уравнения для частного
случая аддитивного белого шума, не упрощенные до конца, позже выводились
также Кушнером [1, 2], причем различные формы записи уравнения и
связанные с этим возможности его моделирования оставались невыясненными.
§ 6.1. МАРКОВСКИЙ ПРОЦЕСС С т состояниями
1. Начнем с конкретизации ряда формул из главы 3 применительно к
марковскому процессу с т состояниями. Фазовое пространство Е = Ет такого
процесса состоит из т точек.
121
Без ограничения общности эти точки можно считать числами 1, Мера ц в
таком пространстве полностью определяется значениями ц(1), \i(m),
поэтому ц можно мыслить как
точку в m-мерном пространстве, а .пространство мер представлять себе как
область этого пространства. В качестве марковской системы мер { yst{x, А)
} можно рассматривать i pLst(a, Р) }, где щДа, Р) при фиксированных
s,t(zT; а, р <zEm представляет собой mxm-матрицу. Оператор Tsi в, Tstg и
в фTst (§ 3.1) будем представлять себе в данном случае как операторы в m-
мерном линейном пространстве. Всякое операторное равенство будем понимать
как поэлементное равенство соответствующих mXtn-матриц.
Пусть задана марковская система мер {ust (а. Р)}, такая, что существуют
пределы (3.1), (3.11):
L(t) - L (s) = lim [In ргА + . . . + In (6.1)
Д-*0
[L* (t) ~ V (s)]ap = lim (a, p) - 6ap + ...
Д-"0
••• + P)~M №-2)
(i|6ap|| = /; {/,•} - А-разбиение интервала [s,/]; lnp^./.+i - матричный
логарифм).
Будем предполагать, что элементы указанных матриц представляют собой
диффузионные процессы, именно, что оператор, определенный равенством
(6.2), имеет вид
U (t) -U (s) = j [А* (у (т), т) dx + Aff (у (т), т) d"уа]. (6.3)
S
Здесь А*, Аа - матрицы с элементами Аар (у, т), Aapa (у, т) которые мы
считаем ограниченными и непрерывными функциями от у 1, ..., yi, t (кроме
того, выполняется условие их дифференцируемости). Далее, {y(t)} = {yi
(t), ..., y\{t)) -
есть диффузионный процесс с параметрами сноса аа(у, t) с матрицей
локальных дисперсий Ьар (у, t). Эти параметры есть функции от у и t,
обладающие такими же свойствами,
ЧТО И Асф, Афо-
Первая формула (3.4) в данном случае принимает вид
t
(a, Р) = 6a3 + j* (a, у) [A* p {у (т), t) dx +
S
+ AvPo(i/(t), x)d,ya(x), (6.4)
аналогичный (2.34). Это уравнение есть стохастическое уравнение (см. гл.
2) и определяет систему мер ps/(a, Р) как
122
функцию от y(t, со) (и следовательно от со), т. е. как диффузионный
случайный процесс.
Если воспользоваться симметризованным стохастическим интегралом,
определенным в § 2.1., то в соответствии с (2.33),
Предыдущая << 1 .. 29 30 31 32 33 34 < 35 > 36 37 38 39 40 41 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed