Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 63

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 57 58 59 60 61 62 < 63 > 64 65 66 67 68 69 .. 97 >> Следующая

меру
Тогда можно ограничиться лишь рассмотрением функций
и апостериорных вероятностей P(dzt\ у(а) = Wt(dzt). Это приводит к
упрощению проблемы фильтрации.
§ 9.2. УРАВНЕНИЯ И БЛОК-СХЕМА ОПТИМАЛЬНОЙ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ
В этом параграфе рассмотрим нелинейную фильтрацию без указанного
упрощения. Основной процесс { Zt, Т) предполагаем марковским. Будем
пользоваться обозначениями глав 5-7.
Апостериорная вероятность P(dzx\yta) по-разному выражается через
апостериорный процесс {ЦТ.} при т>/ и при т < t. Если x^>t, то
вероятность Р (dzt | у\j) может быть получена из Wt (dzt) при помощи
априорной вероятности перехода:
при "начальном" условии
Р (dza | у*а) = Wt (dzu) при u = t.
Таким образом, можно определить P(dZx\ya) при любом т >если сначала
определена мера Wt(dzt).
204
если А ^ если A
utt> stt (utt I Ю = § Ctt (utt> zt)p (dzt I Ю (9-5-a>
P (dzx \у*а)= f Wt (dzt) P (dzx | zt) (t > /).
Это выражение можно рассматривать как решение дифференциального уравнения
dBP (dza I у'а) = [Р (¦ I yl) dLpr] (dzu), (9.6)
Аналогично рассмотрим, как можно найти Р (dza \ у'а), о < t. Для этого
воспользуемся формулой (5.50):
Р (dZo I jfa) = Wa (dZa) Ea (Z", Q). (9.7)
Здесь функция правдоподобия Va(z, Й) является решением уравнения (5.59)
или (5.67) (где нужно заменить t, и на s, / и полагать s(E[cr, ф при
"начальном" условии
V*s (г, Й) = 1, если s = t.
Инфинитезимальный оператор dL (s) указанных уравнений в свою очередь
выражается через 1ES.
Итак, апостериорные вероятности Р (dzx \ yla), Р (dza | у*а), т >/, а < /
можно найти, если предварительно определен апостериорный процесс {IES, s
< ф Последний же отыскивается как решение уравнения (5.57), (5.61) или
(5.66).
После того как получены апостериорные вероятности, нетрудно найти
выражения типа (9.4), а при помощи них и оптимальные оценочные функции.
Описанный способ отыскания оптимальных оценок может быть осуществлен при
помощи автоматически действующего устройства - фильтрующей системы. Ее
блок-схема приведена на рисунке, где a<t<т.
Для конкретности остановимся на рассмотренном в гл. 6 частном случае
процесса с несколькими состояниями. Используя найденный там апостериорный
инфинитезимальный оператор, получаем, что основное уравнение нелинейной
фильтрации, определяющее апостериорный процесс \wa (/)}, имеет вид (6.31)
dwa = WyPyadt + wa [aP- (a) - Mpsap-] bj'a' dya-
i- wa j[aP' (a) a9 (a) - Mps<v<v] b+
205
+ [<v (a) - AVv] dt. (9.8)
Блок I на рисунке моделирует* это уравнение и тем самым осуществляет
преобразование наблюдаемого процесса {yt\ в. апостериорный процесс
{ша(^)}.
Если мера Ft (Л) имеет вид (9.5) (случай фильтрации без запаздывания и
упреждения), то для получения оценки ии требуется лишь сконструировать
блок II, который отыскивает и выдает то значение utt, при котором
выражение
a)wa(t)
а
достигает минимума.
Если представляют интерес оценки ut,x, т > t, то нужно поставить блок
III, который моделирует уравнение (9.6), т. е. уравнения
dpa [и) = Ру (и) Pyadt, /<И<Т V
[Ра (и) - Р {хи = a I Уа}) при "начальном" условии
Ра (0 = Wa (t)
(требуется, конечно, чтобы физически этот процесс протекал-в другом
временном масштабе - значительно более быстро). После определения ра(т)
блок IV выдает оценку atT, соответствующую минимуму выражения
У Ctx {Щх1 а) Ра (т). a
Наконец, рассмотрим устройство, служащее для получения оценок Ща, а < t.
Блок V запоминает прошлый процесс {U7S, s ¦< t] и подает на блок VI в.
разные моменты времени нужные значения этого процесса. Блок VI моделирует
урав- -нение (5.67), имеющее в данном случае вид
- dsVi (a, Q) = ра?У1 (Р, ?2) dt +
+ Vt (a, Q) {[ap-(a) - Mpsap<] bj'c'dy# -
[aP- (a) ac- (a) - М^ауЩг] -
206
dt Г dap.(a) w dai
" ELU M -:
2 . дУя
da,.
-^-[ar(a)-MpsaP']
(9.9)
при "начальном" условии
V\ (a, Q) = l
и при обратном течении времени (так же, как и блок III, в другом
временном масштабе). На его выходе получается процесс V*s (a, й). Блок
VII образует комбинацию (9.7), т. е. апостериорные вероятности
Последний блок VIII, отыскивая минимум выражения
выдает оптимальную оценку uta.
В частном случае процесса с двумя состояниями, рассмотренного в § 6.5,
приведенные выше уравнения и выражения упрощаются. Так, уравнение (9.8)
принимает вид (6.43), а уравнение (9.9) обращается в (6.44).
Аналогично строится фильтрующая система и в том случае, когда
апостериорный процесс имеет бесконечное число состояний. Для простоты в
дальнейшем будем ограничиваться случаем (9.5).
В конце гл. 6 отмечалось, что полученные в ней результаты могут быть
распространены на тот случай, когда марковский процесс {a (t) j- может
принимать значение из бесконечного множества.
Пусть а имеет смысл фазы узкополосного процесса и может принимать
значение из множества [0, 2тс]. Априори пусть фаза является чисто
диффузионным процессом, т. е. описывается инфинитезимальным оператором
где коэффициент диффузии D постоянен.
Наблюдается смесь узкополосного процесса B0cos (соо? + + a (t)) с белым
Предыдущая << 1 .. 57 58 59 60 61 62 < 63 > 64 65 66 67 68 69 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed