Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 68

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 62 63 64 65 66 67 < 68 > 69 70 71 72 73 74 .. 97 >> Следующая

2Kg (N /М + j/^~ Кч+1 (N /Й + ]/~"V ^Й
(q = ц))'
221
В симметричном случае p = v имеем , _ , 2K0(\iN)
(9.47) Ke'OiW + tfiOiN)
При малых аргументах рУ<<( 1 зта функция определяется приближенной
формулой
гнел = 2^1п^-7 + 0Г(р^1п~]-У]> у = 1,781...'. (9.48)
уц/V L У J
При дальнейшем возрастании аргумента р.У она увеличивается до единицы.
2. Линейная фильтрация. При линейной фильтрации оптимальное
преобразование rjo (t) =dt (у*а) ищется в классе линейных преобразований.
По-прежнему берем среднеквадратичный критерий оптимальности. Оптимальное
преобразование можно находить путем решения соответствующего уравнения
регрессии. В это уравнение входят лишь корреляционные функции сигналов ri
(t), у (t). В данном случае, как нетрудно убедиться, корреляционные
функции имеют вид
= , 4^V (т) ^""(т);
(1' + v| (9.49)
ky 'y (t) = (t) + (t).
Уравнения регрессии в данном негауссовом случае совпадают с уравнениями
для гауссовых процессов rj (г1), у (t), имеющих те же самые
корреляционные функции. Поэтому оптимальное линейное преобразование
совпадает с оптимальным линейным преобразованием для описанных гауссовых
процессов. Следовательно, чтобы найти оптимальное линейное
преобразование, можно предполагать, что процессы ц (t), у (t) являются
гауссовыми и имеют корреляционные функции (9.49). Поскольку такие
процессы являются марковскими, при этом снова можно применять теорию
условных марковских процессов, но уже в том плане, как она изложена в §
9.5.
Итак, будем считать, что { г] (И} - гауссов марковский процесс с
корреляционной функцией (9.49), т. е. процесс, соответствующий
инфинитезимальному оператору 4pv д2 / 1 \ d 1
S-<!* + ''> Ч-^J
-
dt.
ц + v dxf
Наблюдается его смесь (9.36) с белым шумом. Этот случай уже был
рассмотрен в п. 1 § 9.4 и в п. 2 § 9.5. Согласно (9.29) оптимальное
линейное преобразование имеет вид
Ло + (I* + v) Ло + ~ Ло = ~ У- (9.50)
где
8pv k2
H2(n + v)i
N
222
В стационарном режиме апостериорная дисперсия k (t) принимает свое
стационарное значение
?=? =,,¦./ (M + V)2^2 + J&_(n + V)yv (9.51) V Р + V
(см. (9.31)).
Легко понять, что средний штраф М{[т] (t) -цо (Ol2 I У1а}> приходящийся
на единицу времени, совпадает для гауссовых процессов с апостериорной
дисперсией k(t). Поскольку она не случайна, повторное усреднение не
вносит никаких изменений и
гМт = м [TI (t) - 1]0 (0J2 = 1 f (Ц + v)2N2 + ----(р + V) N.
V Р + Т
(9.52)
Такой же средний штраф имеет место и для исходного не-гауссового
процесса, ибо он имеет такие же вторые моменты.
Разумеется, результаты (9.50), (9.51) можно получить также на основе
теории Винера.
3. Сопоставим ошибки (9.46), (9.52) линейной и нелинейной фильтрации.
Поскольку при нелинейной фильтрации класс преобразований, среди которых
ищется оптимальное, ничем не ограничен, а при линейной фильтрации
ограничен линейными преобразованиями, нелинейная фильтрация заведомо не
хуже, чем линейная, и, следовательно, гнел-<глии. Представляет интерес,
однако, вопрос о том, насколько гнел меньше, чем глпн.
Ограничиваясь симметричным случаем, ц = v, для линейной фильтрации (в
противовес формуле (9.47)) из (9.52) имеем
глин = 2 j/'р2Л/2 + рЛ/ - 2рЛ/,
в частности
глин = 2]/^ + О(рЛ0 при pjV <<( 1. Сравнение этого выражения с (9.48)
дает
2
= YIn
Глин ур/у
Следовательно,
-> 0 при pTV -" 0,
^лин
т. е. при малых помехах эффективность нелинейной фильтрации оказывается
намного выше, чем линейной.
Глава 10
ЗАДАЧИ НА ОПТИМАЛЬНОЕ ПРЕКРАЩЕНИЕ ПРОЦЕССА
Рассмотрим несколько более общий случай управляемого процесса, а именно
случай обрывающегося процесса. Пусть теперь кроме принятия оценочных
решений (фильтрация) требуется выбирать оптимальный момент прекращения
процесса. При такой постановке теория, рассматриваемая в настоящей главе,
является, с одной стороны, обобщением теории оптимальной фильтрации,
изложенной в гл. 9, а с другой стороны, обобщением последовательного
анализа Вальда [1]. Обобщение идет по двум направлениям. Во-первых,
рассматривается случай непрерывного времени и выводятся соответствующие
ему дифференциальные уравнения для рисков. Во-вторых, производится синтез
последовательного анализа и оптимальной фильтрации (принятие оценочных
решений в течение процесса и в момент его остановки). Эти обобщения
проведены автором в [15].
Дифференциальные уравнения для рисков при непрерывном времени
применительно к задаче Вальда рассматривались Михалевичем [1, 2]. С точки
зрения развиваемой здесь теории задачи, изучавшиеся Вальдом и
Михалевичем, являются вырожденными, поскольку в них отсутствуют априорные
переходы (см. Дополнение, стр. 292). Если допустить подобные переходы, то
решение этих задач затруднится, и в них трудно будет обойтись без
применения теории условных процессов Маркова.
В § 10.6 в качестве примера исследуется задача отыскания оптимальной
остановки процесса на два состояния. Допускаются переходы между ними.
Решение проводится при помощи теории условных марковских процессов и в
Предыдущая << 1 .. 62 63 64 65 66 67 < 68 > 69 70 71 72 73 74 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed