Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 79

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 73 74 75 76 77 78 < 79 > 80 81 82 83 84 85 .. 97 >> Следующая

- W\W2 - + (vw2 - pa^) - + Axwx + A
dt
N
dw^
dwi
гЩ (11.31)
в области S1, где
G
dSf
dwi
Ю-
(11.32);
и уравнению
dS,
dt
2 2 2 d*St'
Wi w2
N
dwi
dSt
+ [w2 - (p + X) Wj] + Axwx + A2wz -f G (11.33)
dwi
в области Ea, где
G<Xwx (wx).
OWi
(11.34)
Если не предполагать с самого начала двукратную дифференцируемость
функции St (oji) по шь то уравнения (11.31), (11.33) для St? D° будут
вытекать из определения 8.8 пространства регулярности D°. По аналогии с §
10.4 мож-
3S
но доказать непрерывность первой производной -- на об-
dw±
щей границе ГЭоу[ областей Hi и Нг. Из (11.32), (11.34) при этом в
результате предельных переходов и
Е3 ) w[ w\ будем иметь
'dSt
dw-t
(шГ)
Xw,
(11.35)
259
Кроме того, сопоставляя (11.31), (11.33), вследствие не-прерывности (по
w\) функции -получаем непрерывность
вторых производных
d2St , г , "V d2St . г m
+0)=-f- (Wi - 0)
дщ дщ
на границе Г.
К приведенным уравнениям нужно добавить "начальное" условие
SjK) = /oK). (11.36)
соответствующее конечному моменту времени. Для первого момента времени
функция Sa (wi (а)) совпадет с полным риском R.
Считая, что параметры задачи постоянны, исследуем стационарный режим
работы. Для этого устремим ft- t к бесконечности. Стационарный режим
характеризуется средними потерями в единицу времени
Y= Пт (И.37)
Ь-/->00 и - t
не зависящими от W\.
Мы предполагаем, что существует предел (11.37), а также предел
/Ю= Пт [S,^) - у (ft - у)], (11.38)
b-t-*OQ
причем до известной степени они не зависят от выбора конечной функции
(11.36). Поскольку St (wi) зависит лишь от разности времен b-t (а не от f
и ft по отдельности), предельная функция (11.38) (как и у) оказывается не
зависящей от df
времени: =0. Учитывая это при подстановке выражения
S/(o"i) = y(b - t)+f(w1)+o( 1) в уравнение (11.31), получаем
у 0(1)= ~ui2lw22-^L + (\W2 - +
dt N grf dwx
+ A1w1 + Aiw2+-^-0(l)+ ^-o(l) (11.39.3)
дщ dwx
и, переходя к пределу b - t~* оо,
если
dt
o(l) =o(l);
dwi
о (l) = о ei);
dwf
0(1) =0(1).
Условие (11.32), определяющее теперь не зависящую от' времени область Еь
где справедливо (11.39), принимает вид
df / \ ^ G
-кх-
dwi 4 " kwi
Аналогично из (11.33) выводим уравнение
(11.40)
- Wi W2 --[- [\w2 - (р, -f- К) -¦--[- Axwx +A2i^2+G-Y=0"
dwi
dwi
(11.41)
выполняющееся в области 32, где
df
К) >
(11.42)
dwi kwi
На общей границе wf областей Ei и E2 выполняются условия непрерывности
двух производных (первой и второй) и со-
отношение
f- (ИГ) =
dwi
kw.
(11.43)
которое следует из (11.35).
Для полного определения функции / (wt) требуется добавить еще условия на
границе области достаточных координат, т. е. условия в точках W\ = 0 и W\
- 1. В данной задаче они имеют тривиальный вид:
df
dwi
Ю)
<оо;
df
dwi
(1)
< оо.
(11.44)
Как может быть подтверждено анализом результатов, области Ej, Е2 имеют
такое естественное расположение: область нефорсированного режима Ei
располагается слева и является интервалом [0, wtr), область
форсированного режима совпадает с интервалом (w [ , 1]. Интегрируя
уравне-нение (11.39) с учетом первого условия (11.44), получаем
df
wt
- (w,) = - Г ev&)
'1 2 J
Y - Л1 - Л(1 - I) / г
л ----------- - dl, w1<wl,
dwl ' " 2 I ёа (1 - g)2
(11.45)
где ф (wi) определяется формулой (10.52). Аналогично (11.41)
261
и второе условие (11.44) дают
JL (Ш1) = -" г/а(r)
Лщ 2 J Е-(1-1Р
w1 > w\ (11.46)
(фл К) = \ N (v - ц - Я)
In
BDi V Jl + X,
Ш2 О"! Ш2
Условие (11.43) и условие непрерывности первой производной, если
использовать (11.45), (11.46), дают систему двух уравнений
шГ
щ е-Ф(шГ) Г - Л В - g) .
J g"(l - gp NX'
О
w\ Г еЧ>я<5> АгЪ+А2{\ - D + G - у " _ 20
J ?¦ (1 - NX '
*1
которая позволяет определить обе неизвестных величины: w\ и
Интегрированием выражений (11.45), (11.46) находится фунция / (а/i) с
точностью до аддитивной .достоянной. В стационарной теории эта постоянная
остается неопределенной, так как ее величина определяется конкретным
выбором функции fa (wi) в условии (11.36). Для ее расчета потребовалось
бы решение нестационарных уравнений (11.31), (11.33).
Анализ выражения (11.45) при значениях wu близких к 1, показывает, что
4/ / \ a4i -j- G - Y I /1 \
--(W]) =----------1 ¦ +0l_,,(l)
dwi -J- Я
(oi-e,, (1)-" 0 при ^->1).
Используя это для проверки неравенств (11.40), (11.42), получаем
соотношение
Ai + G - у G_
[д. -J- Я Я
т. е.
- (A1~y)>G,
М'
как необходимое условие описанного выше нормального расположения областей
Sj, В2. Оно есть не что иное, как усло-
262
вие экономической оправданности форсированного режима. Если оно не
выполнено, то область Нг форсированного режима полностью отсутствует.
§ 11.3. ДРУГАЯ ЗАДАЧА НА ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ.
СЛЕЖЕНИЕ ЗА БЛУЖДАЮЩЕЙ ТОЧКОЙ
Если в предыдущих задачах исходный процесс тр был процессом с двумя
состояниями, то теперь рассмотрим тот случай, когда он является
диффузионным процессом. Описываемая ниже задача типична для
автоматического регулирования.
Пусть процесс g (t) имеет постоянный коэффициент диффузии D и постоянный
Предыдущая << 1 .. 73 74 75 76 77 78 < 79 > 80 81 82 83 84 85 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed