Научная литература
booksshare.net -> Добавить материал -> Математика -> Скороход A.B. -> "Вероятность: основные понятия, структура, методы." -> 93

Вероятность: основные понятия, структура, методы. - Скороход A.B.

Скороход A.B. Вероятность: основные понятия, структура, методы. — , 1989. — 279 c.
Скачать (прямая ссылка): skorohod.djvu
Предыдущая << 1 .. 87 88 89 90 91 92 < 93 > 94 95 96 97 98 99 .. 110 >> Следующая

X i X

Отсюда вытекает, что sup \ U (t, x) — U (t, x) 1 = 0. □

x

в) Оптимальные и е-оптимальные управле-
ния. Пусть U(t,x)—решение (20) и существует измеримая
функция u = <p(t,x), для которой

f{t,x,y(t,x)) + l [U (t, х')-U (t, х)} X
X к (t, x,v(t, х)) я(t, x,y{t, х), dx') = -dU{td't х). (22)

Тогда можно рассмотреть марковское управление г|(0 =
= ф(М(0)» процесс |(0 есть скачкообразный марковский про-
цесс с инфинитезимальными характеристиками К (t, х, ф (/, х)) и
si(t, х, q(t, х), А). Покажем, что

М (j / (s, I (s), ф (s, % (s)) ds\l(t) = x^j = U{t, х).

Используя те же рассуждения, что и при выводе (21), находим
для функции

U*(t,x)=m(^f(s,l(s), <P(s,l(s))ds\l(i) = x^
уравнение

U*y,x)-U*(t + h,x)= \ f{t,x,<p(s,x))ds +

_tj-h

+ \ K(t, x, ф(5, x))^n(t, x,<p(s, x), dx')X

t

X [и* х')-и* х)\ с?5 + о (а),

откуда

--^—- = х, ф(*. *)) +

+ х, ф(*, .*;))$ я (г1, л, ф(Л х), 41х')[и*Ц, х') — И*у, х)]. (23)

Из (22) вытекает, что £/(/, х) удовлетворяет тому же уравне-
нию с тем же начальным условием. Значит,

иу, х)=и*У, х).

Аналогично устанавливаем, что если фЕ(£, х) такова, что

/(*, х, фе х)) +

+ Л, (г1, фе л)) ^ я (г1, л, фе (г1, *), [с/ (г1, х') - и (г1, х)] <

х)

то л (0 = фЕ (^, 1 (0) будет управлением, для которого

М ^ / («, I («), ф («, I {5))) | I (0 = x^ < и (*, л) + 8 (г - О

для всех ^б[0, Т] и х.

3.2. Управляемые диффузионные процессы. Для простоты
формулировок ограничимся одномерным случаем: Х = И, =
=ШЯ. Одномерный диффузионный процесс определяется свои-
ми диффузионными коэффициентами: коэффициентом переноса
а((,х) и коэффициентом диффузии Ь(1,х). Для управляемого
диффузионного процесса эти функции зависят еще от управле-
ния и&и. Таким образом управляемый диффузионный процесс
задается своими диффузионными коэффициентами а(£, х, и),
Ь^,х,и), они предполагаются измеримыми по совокупности
переменных и локально ограниченными.

Будем рассматривать два вида управления для таких про-
цессов: ступенчатые и марковские. В случае ступенчатого уп-
равления управляемый процесс строится по интервалам по-
стоянства управления, при фиксированном значении процесса
и управления до момента начала такого интервала, его услов-
ные распределения на самом интервале совпадают с распреде-
лениями диффузионного процесса с диффузионными коэффи-
циентами а(1, х, и), Ьу,х,и), где и фиксировано наложенным
условием. Процесс при марковском управлении и=ф(^,л;) яв-
ляется диффузионным с диффузионными коэффициентами
а (^ х, ф (Ь х)) и Ъ у, х, ф (^ х)).

Результаты для управляемых диффузионных процессов по
форме аналогичны тем, которые получены для скачкообразных
процессов, однако их доказательства, особенно выяснение ус-
ловий существования решений уравнения Беллмана, весьма

сложны. Поэтому здесь мы приведем только формулировки не-
которых результатов.

Пусть U (t, х)—цена управления, если стоимость управления
т

есть J f(s, x(s), y(s))ds, при условии, что x(t) = x, f (s, x, и) —

t

измеримая ограниченная функция своих переменных. Предпо-
ложим, что функция U(t,x) дифференцируема по / и дважды
дифференцируема по х. Тогда U (/, х) удовлетворяет следующе-
му уравнению (Беллмана)

dU(t, х) Г х , ч dU(t, х) ,
--57—- = sup yf (t, x, u) + a(t, x, и) dx +

, 1 , ,, ч d2U(t, x)

+ -2-b(t, x,u) d\2

и граничному условию U(T, x) =0.

Аналогичное уравнение можно получить и для более общей
функции стоимости вида

j f (s, х (s), и (s)) exp Jj g (s, x (s'), и (s')) rfs j dsO (x (T)). (24)

Если V (t, x) — цена управления для этой стоимости управления,
то в случае существования производных ^- V (t, х), ^ V (t, х)

д'г

и j^- V (t, х) выполнено уравнение

- dV«'x)= sup [/ (t, х, u) + g(t, x, и) V (t, x) +

+ a (t, x, и) д-Ц^ + I b (t, x, и) d^^] (25)

и V(T, х) = Ф(х).

Если решение (25) существует и измеримая функция и = ср (t, х)
такова, что

/ (t, х, Ф (t, х)) + g (t, х, ф (t, х)) V (t, х) +

+ a(t, х, ф(А х)) д-Ц+^ + ~2 b (t, х, Ф(t, х)) dW£ х) =

= _Щ£*>, (26)

то к=ф (t, х) — марковское оптимальное управление.

Если измеримая функция и=Фе(А х) такова, что при Под-
становке этой функции вместо ф в левую часть (26) получим

^ dV(t, х) . л t ...

выражение, не превосходящее--^--|-е, то и(г) =

==Фе(^,х(0) будет е (Г — ^-оптимальным управлением на [t, Т].
230

Глава 3
ИНФОРМАЦИЯ

Получение, хранение, передача информации — мы сталкива-
емся с этими явлениями непрерывно. Понятие информации воз-
никло давно, оно носило чисто качественный характер. Необхо-
димость измерения ее количества появилось при разработке
способов ее хранения и передачи. При этом выяснилось, что,
несмотря на качественное различие (словесная информация,
изображение, музыка и т. п.) при равном количестве, информа-
ция может преобразовываться одна в другую. Наиболее про-
стой вид имеет информация, записанная двоичным кодом,
среднее число двоичных знаков, необходимых для записи ин-
формации, и есть, грубо говоря, ее количество. Теория инфор-
мации — один из прикладных разделов теории вероятностей и
входит в цикл наук, составляющих кибернетику. Основная ее
задача — изучение возможностей передачи информации. При
этом учитывается, с одной стороны, случайность сообщений,
которые следует передать, с другой стороны, возможные ошиб-
ки в процессе передачи, имеющие также случайный характер.
Оказывается, даже при наличии ошибок в передаче можно пе-
редать информацию безошибочно с вероятностью, как угодно
близкой к единице. Как это сделать, и учит теория инфор-
мации.

Предыдущая << 1 .. 87 88 89 90 91 92 < 93 > 94 95 96 97 98 99 .. 110 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed