Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 67

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 61 62 63 64 65 66 < 67 > 68 69 70 71 72 73 .. 97 >> Следующая

переменные {та, ур}, которые в совокупности и будут составлять вторичный
апостериорный марковский процесс. Этим переменным соответствует, как
нетрудно получить из (9.33), вторичный апостериорный инфинитезимальный
оператор
= аа (т, у, t) + а9 (т, у, t) +
+ ~ Ф?'а + do-ykya) фв, (60'Р + do'ftM ' +
+ W-'p, (V" + dp'p^pa) dfad~ ¦ + y Ьяр дуд^ (9.34)
(функции ka$(t) предполагаются известными).
Вторичный марковский процесс {та,у9\ протекает в том же
(т + /)-мерном пространстве, что и априорный процесс z = {xa,yp).
§ 9.6. СРАВНЕНИЕ ЭФФЕКТИВНОСТИ ЛИНЕЙНОЙ
И НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ ДЛЯ ОДНОГО ПРИМЕРА
В настоящем параграфе будет рассмотрена нелинейная и линейная фильтрация
марковского импульсного сигнала с двумя состояниями т) (f)=±l, смешанного
с белым шумом, при среднеквадратичном критерии. Априорные вероятности Р {
г] (t) = ± 1 } = рь2 пусть удовлетворяют уравнению
Pi = - Pi = - № + vPv (9.35)
где р и v постоянны. Наблюдается процесс
t
У Ф) = }' Ц (т) dx + l(t) (9.36)
а
•(? (t) - винеровский процесс; М? = 0; МД?2 = NAi).
1. Нелинейная фильтрация. Данный пример является частным случаем
процесса с конечным числом состояний, рассмотренного в гл. 6 и § 9.2.
Основное уравнение нелинейной фильтрации имеет вид (6.43), причем теперь
ур= у, а9 (1) = 1;
2 18
dp (2) = - 1, bpa=N. Если ввести обозначение wi - ю2 = = z, то указанное
уравнение примет вид
2 = v- р, - (р + v) z + ./V-1 (1-z2) у. (9.37)
Отсюда видны те преобразования, которые нужно совершить
над {у it)), чтобы получить {z(t)\, а следовательно, и апосте-
1 ± z
риорные вероятности wi,2 = ---•
Пусть и (t) = т)о (t) -оценка сигнала т) (t), соответствующая
среднеквадратичному критерию качества. Тогда, очевидно,
т)0(0 = М [л (0 |"/']¦=*(/) (9.38)
и средний штраф, рассчитанный на единицу времени, равен
'нел = М {[Т) (() - Ц0 (t)]2} = ММ {[Т] (t) - Т)о (О!2 | У*а) =
= М[1- z2(t)]. (9.39)
Формулы (9.37), (9.38) дают в данном случае решение задачи нелинейной
фильтрации при отсутствии опережения и запаздывания (случай (9.5)). Для
полноты изложения приведем решение задачи также при наличии опережения
или запаздывания, т. е. укажем способ отыскания оценок М[т)(т)| у*а],
т>/и М [т] (а) | у1а\, а<Е
Решение уравнений (9.6), (9.35) при начальном условии Pi,2(0 =W\^{t) в
данном случае находится без труда. Оно имеет вид
М [Л (Д | у*Л
|Х + V
2 (Е)
e-(M+v)(T-t)t х Е
Далее, в противоположном случае о < t, применяя формулу (9.7), имеем
Р (Л (а) = 1 | у'а] = Л+jiSL По (1, Q); (9.40)
Р{л(о) = -1|^} = ^=^Р1г(-1,Й). (9.41)
Если обозначить
Щ\, Q)_V*(_1, Q) =o(s)
и использовать тот факт, что сумма выражений (9.40), (9.41) равна
единице:
то будем иметь
V[(± lfQ) = l-i-Z(s)0(S)±-i-0(s)
и, следовательно,
М [л (о) I У*а] =
И0(-1,0) =
= г(а) + у и(а)[1 - г2 (а)].
(9.42)
Входящая сюда функция г (о) определяется уравнением (9.37), а для функции
v (s) из (6.44) получаем уравнение
- v(s) = - (ц + v)n(s) + [1 -z(s)v(s)]y(s) (S < О
при обратном течении времени и при "начальном" условии
Качество оценки (9.42) по среднеквадратичному критерию определяется
формулой
м {[л (о) - Ло (°)]2 I Уа\ = 1 - [2 (°) + ~ V (°) [ 1 - 22 (°)]]2-
Возвращаемся к фильтрации (9.38) без опережения и запаздывания. Вычислим
средний штраф (9.39) в единицу времени для установившегося стационарного
режима фильтрации.
Уравнение (9-37) определяет процесс { z (?)} как некоторый "вторичный"
апостериорный марковский процесс. В стационарном режиме фильтрации он
является стационарным. Если через рст (z) обозначить стационарную
одномерную плотность распределения вероятностей этого процесса, то
средний штраф (9.39), очевидно, можно записать
Найдем стационарную плотность рст (г). Как отмечалось в гл. 6,
"вторичному" апостериорному процессу { ал, у} соответствует
инфинитезимальный оператор (6.46), имеющий в данном случае вид
v(t) = 0.
(9.43V
220
2
Ввиду .того что коэффициенты vw2 - рцщ, - не
зависят от у, одномерный процесс {(r)i} сам по себе оказывается марковским
и имеет, очевидно, инфинитезимальный оператор
= (vw2- №)-1(9.44) dt owi N dwj
Производя замену переменной г = w± - wz = 2wt- 1, нетрудно получить, что
в данном случае уравнению (9.37) соответствует инфинитезимальный оператор
d%z =_L(l_22)2_i!__p. [v - pi - (ц-f v)z] d
dt 2 N d 22 dz
процесса {z(^)}. Записывая уравнение Фоккера - Планка
[(1 - г2)2Р(г)] - - Iх - (Р + v)2]p(z)}
2 N dz2 dz
и приравнивая нулю производную рст = 0, обычным способом получаем
стационарную плотность распределения
2
Р*(2) dz = ехР {2Л/ J [V - ц - (ц + V) X] dz.
(9.45)
Удобно ввести новую переменную ср при помощи формулы
-!- = ch2 - = - (1 -f ch ср).
1-г* 2 2 v
Тогда стационарное распределение (9.45) будет иметь вид Рст (ф) dtp =
const (ch ср + 1) exp |- (v - pi) (sh cp + cp) -
- ~ (P + v) ch ф} dtp.
Используя (9.43) и взяв получающиеся интегралы при помощи известной
формулы 6.444.1 справочника И. М. Рыжика и И. С. Градштейна [1], находим
гнел =М(1 - г2) =
АКп (N j/uv)
=-----------------------------ч->.- ^ -------------------------- (9.46)
Предыдущая << 1 .. 61 62 63 64 65 66 < 67 > 68 69 70 71 72 73 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed