Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 83

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 77 78 79 80 81 82 < 83 > 84 85 86 87 88 89 .. 97 >> Следующая

регулируемого объекта. Пусть у2 (t) есть компонента двумерного
марковского процесса (у2 (t), v (t) = = y2(t)), причем уравнение (11.48)
заменяется на уравнение
X~l dv (t) + v (t) dt = dut + dt,2 (t), (11.79)
где t,2 {t)-тот же самый винеровский процесс. Последнему уравнению
соответствует инфинитезимальный оператор
dLpr = dtv-jj- + X (dut - vdt)~ + 2Lx*dt (11.80) 272 '
Переход от (11.48) к (11.79) можно аргументировать учетом инерционности
регулируемого объекта. Если совершить предельный переход Я->со
(инерционность стремится к нулю), то (11.79), очевидно, обратится (в
11.48).
Условие 8.7.Б требует теперь добавления переменной v (t) к числу
достаточных координат. Заменяя оператор
, д , х д2 dut I- + ~ "ТТг"
дУ2 2 ду%
на оператор (11.80), получаем для. данного случая основное уравнение в
виде
dlt(x, V) ==(a_v)Mi___x(v±Uo)JSL +
dt ox dv
. 1 Щ d2S( . x d2S( . о i и /ri oi\
H --------- H------X2----- -\-x2 + kt (11.81)
2 N dx2 2 dv2 * v '
в областях Si(2> где
sign = ± 1. dv
По аналогии с предыдущим на общей границе Г указанных областей
выполняется условие непрерывности и исчезно-
" dSt
вения первой производной -
dv
6. Вследствие увеличения числа переменных решение уравнений (11.71),
(11.73), (11.75), (11.78), (11.81) значительно труднее, чем уравнения
(11.60), (11.62), поэтому для них не удается получить общие и точные
результаты. Однако в различных частных случаях, если использовать
специальные соотношения между параметрами задачи, можно применять те или
иные асимптотические методы (методы малого параметра) и получать с их
помощью приближенные результаты.
Так, в работе Стратоновича [18] был разработан и применен для решения
стационарного варианта уравнения (11.73) асимптотический метод,
учитывающий малость коэффициентов при диффузионных членах (членах со
вторыми производными). Решение при этом получается последовательными
приближениями, результаты первых приближений находятся без особого труда.
В других специальных случаях могут быть разработаны другие приближенные
методы. Пусть, например, представляет интерес исследовать тот случай,
когда причины, учитываемые в настоящем параграфе и приводящие к
усложненным уравнениям, не очень сильно влияют на окончательные
результаты, не очень сильно возмущают задачу, рассмотрен-
273
ную в § 11.3. Тогда можно подсчитать возмущение в первом приближении, во
втором и т. д., пользуясь регулярными методами последовательных
приближений, которые, как правило, могут быть применены в подобной
ситуации.
Не рассматривая здесь регулярные методы последовательных приближений для
решения уравнений (11.71), (11.73),
(11.75), приведем простое приближенное решение их в указанном специальном
случае. Остановимся для конкретности на уравнении (11.73). При каждом
конкретном значении координаты т быстро успевает установиться
квазистационарное распределение вероятностей по второй координате х.
Координата т при этом не успевает существенно измениться. Квазиста-
ционарным флюктуациям по х, как видно из (11.73), соответствует уравнение
4" Г4г + "КТ + (а° + °1т + "~Г~ + *2 + k = Y ("*)•
2 \ N J дх2 дх
Решая последнее, по аналогии с § 11.3 (11.69) находим зависящие от т
квазистационарные средние штрафы и ква-зистационарную границу:
1 { \ 2 Uq + (а0 + сРт)2
у (т) kt+ 2 N +Kj [ц2_(ао + flim)2]2 '
(а° + О-т) (k2N~l + к)
ХТ (т) =--------s--------------.
V ul-(d> + dLmf р
После этого можно перейти к рассмотрению диффузии второй координаты т.
Если St (т) - функция, зависящая только от переменной т (усредненная по
флюктуациям второй переменной х), то, как нетрудно понять, используя
(11.72), она описывается приближенным уравнением
- dSt(m)- = - -!-+ (а0 + а*/п) - + у (т).
dt 2 N dm2 ' dm r '
Разработка регулярных методов дает обоснование приведенным результатам и
позволяет получить более точные результаты, соответствующие высшим
приближениям. Условием применимости этих результатов и приближений
является малая величина коэффициента а1.
7. Рассмотрим в заключение подробнее один метод последовательных
приближений, пригодный для решения уравнения
(11.78), который близок к методу, изложенному в книге Стра-тоновича [8],
стр. 106-110, 115-117. Как и в описанном выше случае, условием его
применимости является близость к невозмущенному режиму, т. е. большая
величина параметра К.
Будем рассматривать стационарное решение, как в конце
274
§ 11.3. Уравнения для стационарных апостериорных дисперсий получаем,
приравнивая нулю производные по времени в (11.76). Это дает
Ь, _ . и_U2 I 1 ъз •
"6ч - w . "лл - w % н 2N% V
k2 + - /4 -)-------1-k* = DN.
^ IN & 47W2 й
He представляет труда получить асимптотические решения этих уравнений
D 2 к
% = VDN- +О (К-2);
Вводя переменную у = Y 2А,Ут]0/Ац, запишем стационарный вариант уравнения
(11.78):
1^" '^"5")+ ^ (а + УГ у + u°)ir+
+ "-^- + "2 + %-Y=° (11.82)
/~2
Вместо одной функции двух переменных рассмотрим последовательность
функций от одной переменной
Предыдущая << 1 .. 77 78 79 80 81 82 < 83 > 84 85 86 87 88 89 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed