Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 13

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 7 8 9 10 11 12 < 13 > 14 15 16 17 18 19 .. 97 >> Следующая

<5оЛл ~ даХг д7^ _ д7Хг
я~ - ~у (V - ~ ffvr-<?л:м <?^v
Вторично делая эту подстановку, получаем
доЛ _ а / д7к \ д7х дапг дчх
dxv дху V дхк j дхх дх" дх" дх.
Следовательно,
да, г ~ дх, даvr д2х,
-?-о"г = ---------- OvrH - *xv (2.30)
av дг р** axv %r^vP*K v '
Вычитая из (2.29) половину выражения (2.30) (в соответствии с (2.28)),
убеждаемся в справедливости последней формулы (2.27). Доказательство
закончено.
Отметим, что вследствие симметричности и неотрицательной определенности
матрицы локальных дисперсий всегда
существует хотя бы одна подходящая система действительных -> ->
векторов (7i,..., щ. Именно, если ||-ортогональное преобразование,
приводящее эту матрицу к диагональному виду: blnUlrU^,s = b%rs , ТО bln =
UirUnrb°r и, очевидно, можно положить air = UirVb°r (/ = Rang[|6^||).
§ 2.3. ИНВАРИАНТНАЯ ЗАПИСЬ УРАВНЕНИИ КОЛМОГОРОВА
Инвариантная запись уравнений Колмогорова в произвольных криволинейных
координатах предлагалась в работах Колмогорова [1] и Яглома [1]. В первой
из них рассмотрение было ограничено случаем невырожденной матрицы
41
локальных .дисперсий, которая выбиралась в качестве метрического тензора.
Во второй работе метрический тензор предполагался независимым, но были
введены существенные ограничения по другой линии. Именно, метрическим
пространством предполагалось не все фазовое пространство марковского
процесса, а лишь пространство, соответствующее половине его переменных
(координатам). Матрица локальных дисперсий, напротив, соответствовала
лишь второй половине переменных (скоростям) и опять-таки предполагалась
невырожденной (в пространстве скоростей).
Введенные выше вектора т, оу позволяют получить инвариантную запись
уравнений Колмогорова в общем случае для произвольного метрического
фазового пространства. В специальных случаях, отмеченных выше, эта форма
записи не совпадает с предложенными ранее формами, а является более
простой.
Начиная с этого места будем предполагать фазовые переменные
контравариантными компонентами вектора и записывать их дифференциал dxx.
В соответствии с теоремой 2.5 рассматриваемые в ней вектора,
следовательно, также являются контравариантными, поэтому будем записывать
их тх, ох (г) (индекс г пишем в скобках, поскольку он не имеет тензорного
характера).
Рассмотрим марковскую плотность вероятности перехода р(х, t; х', t') из х
в х' за время от t до t'. Уравнение Колмогорова первого рода
_*!Ц=аьдр+±Ь *Е_ dt дх 2 дх дхц
при учете (2.26) преобразуется к инвариантному виду
dt дх 2 дх
др
дх*
(2.31)
В самом деле, вероятность перехода р(х, t; х', t') как функция от х
является скаляром. Поэтому скалярами являются и
выражения ей* -- V, а следовательно, и ох - д\
Таким образом, в правой части (2.31), как и в левой, стоит скаляр.
Аналогично подстановкой формул (2.26) уравнение второго рода (Фоккера-
Планка)
=-------[°ХР\ "I- от-йГ~ [Ьх*р\
dt' дх'х у 2 дххдх*
преобразуется к виду
др д . I д
= ------------- [щХп] _
dt' дхх ^ 2 дх
(г) Л-к (г)р)
.(2.32)
42
Рассматриваемая как функция от х', вероятность перехода
р(х, t; х'\ t') является скалярной плотностью, т. е. преобразуется
_ 1
как Yg = det21| gap II- Поэтому тар, о^р являются векторными плотностями.
Но, если векторная плотность, то, как известно,
дивергенция -Дт31я снова является скалярной плотностью. По-
дх
этому -^-(т^р), -Д- (а^р) = 5В, а также -Д- (Ф-33) являются дх к дх д
дх
скалярными плотностями, подобно величине, стоящей в левой
части (2.32).
Можно ввести поток вероятности
@я = гФр - _L оЛ (г) [о*4 (г) р],
являющийся векторной плотностью. Тогда уравнение (2.32) примет вид
уравнения сохранения
др | п
dt' дхк
Указанные уравнения (2.31), (2.32) соответствуют одному и тому же
инвариантному инфинитезимальному оператору
rfi = {mi^ + T
Г
В уравнении (2.32) он подвергается транспонированию.
§ 2.4. СТОХАСТИЧЕСКИЕ ЛИНЕЙНЫЕ ОПЕРАТОРЫ
Будем предполагать здесь, что в формуле (2.16) функции Ч'я, Фар ,
А=1,...,?; р = &+1,..., k + l линейно зависят от
х1, xh'-
Ч'а = Да (У, t) Хц] Фа,4+о = АцХо (у, t) Хц
и ЧТО
фАч = ( При ^ = (Х,|* = 1, с = 1, ...,/).
( 0 при К ф р;
Тогда уравнение (2.16) принимает вид
t
Х% (/) = *я (S) + j [Ля (у (t), т) dx + ЛАа (у (г), х) dyc (т)] Хц (т).
(2.33)
43
Мы предполагаем существование решения этого уравнения. Применяя теорему
2.2, последнее уравнение можно записать также при помощи интегралов в
смысле Ито.
t
ХХ (0 = *Я (S) + j % (т) 1АЬ. (У (Т)- т)dx + Дчю (У (т)' т)d*У° (т)1*
(2.34)
ГД6 дА
ХцА^я = X^Afxя Н А^ХдУцо ~\ r~ Xix Ьол< = Xv Avlxn bjia,
2 2 оул
и следовательно,
Идя = Ajxi + - A)xynAvxaban. + --И- Ьая. (2.35)
2 2 дуя
Введем два семейства операторов L(t), U (t) с матричными элементами
t
[L (0W = [L (s)]ju + [А"я (у, т) dx + А^ха (у, т) dya (т)];
(2.35а)
t
[Т*(^)]ця = [?*(S)W + J [Идя (у, х) dt -f Идяо (у, т) d уа (t)].
S
При помощи них формулы (2.33) (2.34) записываются в виде
t
х (t) - х (s) = | x (t') dL (t')\
S
t
x(t) - x(s) = J*(0 d*L* (t').
Предыдущая << 1 .. 7 8 9 10 11 12 < 13 > 14 15 16 17 18 19 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed