Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 80

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 74 75 76 77 78 79 < 80 > 81 82 83 84 85 86 .. 97 >> Следующая

снос а. Наблюдается его сумма с белым шумом или, что в сущности то же
самое, процесс
yi(t)= j l(*)dr + b(t)' (11-47)
т"
где ?i (t) -винеровский процесс: М?1 = 0; МА^ = N&t. Кроме того, имеется
процесс у2 (t) (координата регулируемого объекта), который также
предполагается известным наблю-дателю-оператору. Пусть он описывается
уравнением
йуг (t) = duf + d?a- (11.48)
Здесь ?2 (t) - винеровский процесс с дисперсионным параметром и: АЦ2
= 0; МД?1=хДг,
a dut - смещение, обусловленное сервомотором, которым управляет
наблюдатель-оператор. Процесс {ut} является в данной задаче процессом
управления. Будем считать, что скорость сервомотора ограничена по
абсолютной величине значением "о, т. е., что
\u(t2) - u(tj) | <и0|*2 - tx |. (11.49)
Пренебрегая инерционностью сервомотора, не будем вводить других
ограничений на процесс управления.
Пусть назначение следящей системы в том, чтобы процесс у2 (t) возможно
точнее копировал координату g (t) блуждающей точки. Если С (| - у2) ¦-
функция, соответствующая критерию оптимальности, то функция штрафа будет
иметь вид
с'= ^С{Ъ(х)-уг{х))йх. (11.50)
т"
В этой задаче основной марковский процесс zt является диффузионным и
состоит из трех компонент \(t),y\ {t), г/2 (0, причем наблюдаются две
последние компоненты. Подобные случаи рассматривались в гл. 7. Априорный
инфини-
263
тезимальный оператор основного процесса имеет вид
dL r = dt fa -Ц--Ь Е --) + dut - Ь р \ 91 дуг I ду2
+ JL (D- +N - +х-V (11.51)
2 ^ *5* ду* д&
Проверка признаков 8.7.А-В показывает, что (при подходящем выборе
заключительных штрафов с-сь) наблюдаемые процессы у\ (t), у % (t) и
апостериорная плотность распределения вероятностей wt(l) образуют в
совокупности достаточные координаты. Если начальное распределение wa(|)
гауссово, то и в любой другой момент времени апостериорное распределение
будет гауссовым:
(6-тД*
' • <u-52)
Поэтому, вместо того чтобы рассматривать апостериорную плотность (11.52),
можно рассматривать ее параметры mt, kt. Подобное упрощение было
разобрано в § 9.5. Процесс с оператором (11.51) относится к процессам,
которым посвящены п. 1 и и. 3 § 9.5 (не зависящие от координат
локальные
дисперсии и линейно зависящие сносы). Поэтому к данной задаче применимы
изложенные там результаты.
После замены плотности распределения (11.52) на параметры mt, kt
достаточными координатами будут переменные mt, kt, у\ (t), г/2 (t).
Уравнения для mt, kt получаем/конкретизацией формул (9.33). Учитывая
простой вид локальных
параметров в (11.55), находим
mt = a + -~^-(У1 - mt)' k]
kt = D-----------------. (11.53)
f N
Если k0 - начальное значение апостериорной дисперсии, то решение второго
уравнения (11.53) имеет вид
vyiL ____
k = уШГ (k* + VDN)e N +b>-VDN ^
2t ~\f
JL_______________________________________________________________________
___
(k0 + VDN ) e r N -k0 + /DN
k0 ch t Y ¦§- + VDN sh * Y'
= VDN ----------------------------------------- -=• (11-54)
264
Этот параметр, поскольку он определен, можно не относить к числу
достаточных координат, рассматривая функцию St(kt, mt, уi (t), г/г(0) как
Функцию времени и остальных достаточные координат. Тогда мы будем иметь
три достаточные координаты mt, у\ (t), г/2 (О - В соответствии с формулой
(9.34) они имеют вторичный апостериорный инфинитезимальный оператор
з (/) = dt (а --1- т -- + dut ----1-
3 W I dm dyi J * dy2
+ Л-.(А.-*- + 2Ь-^- + Ы-+х-\ (11.54) 2 у N dm* dm dyi dy\ dtfc
J
Ввиду того что функция С (g - у2) в (11.50) зависит не от всех трех
координат у\, уг в отдельности, а лишь от разности g - уг, в данной
задаче можно провести дальнейшее сокращение числа достаточных координат.
Функция
st К, ylt У2) = ^С(Ъ - уг) wt (I) d I
пг
Y 2л kt
Jcto-^ + rOe 2k'dr\ (11.55)
оказывается зависящей только от разности mt - y2(t) = x(i). Если, в
частности, С (? - уг) = (? - уг)г, то
st (mt, ylt у2) = [mt - уг (012 -f kt = x2 (t) -f kt. (11.56)
Как следует из вида оператора (11.54), двумерный процесс (mt, уг)
является марковским сам по себе и имеет оператор
ли> л* <5 , л d , dt ( kt d* . d* \
djoo - dt CL----\~ dll*---f------- I к - I.
dm ^ 1 dy2 2 I N dm? ^ dy\ j
(11.57)
Более того, разность x(t)-mt-г/2(0 представляет собой одномерный
марковский процесс с оператором
±-+Ж-(?+к)±
dx 2 V N dx*
Поэтому условие 8.7.Б не вынуждает добавлять к Xt какие-либо другие
координаты. Как следует из (11.55), (11.56) и из простого характера
ограничений (11.49), этого не требуют и другие условия 8.7.А,В, так что
x(t) оказывается единственной достаточной координатой.
Дальнейшее рассмотрение аналогично рассмотрению предыдущего параграфа.
Вследствие (11.58) аналог уравнения
265.
(11.30) имеет вид
^lW=s,W+A (Д + *)Д|ЦД +
+ min (a A - Au) dS^x^--f (x2 + kt) A -f о (A), (11.59)
-ы0Д<Ды<ы0Д dx
(A w = w, - w,_A).
Здесь выбран среднеквадратичный критерий качества, приводящий к функции
(11.56). Для функции St(x), принадлежащей пространству регулярности,
справедливо уравнение
Предыдущая << 1 .. 74 75 76 77 78 79 < 80 > 81 82 83 84 85 86 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed