Научная литература
booksshare.net -> Добавить материал -> Физика -> Федоренко Р.П. -> "Введение в вычислительную физику" -> 181

Введение в вычислительную физику - Федоренко Р.П.

Федоренко Р.П. Введение в вычислительную физику — М.: Физ-тех, 1994. — 528 c.
ISBN 5-7417-0002-0
Скачать (прямая ссылка): vvedenievvichesleniyah1994.djvu
Предыдущая << 1 .. 175 176 177 178 179 180 < 181 > 182 183 184 185 186 187 .. 210 >> Следующая


463

Определим «функцию Гамильтона»:

т

H[t, х, и, g] = (/(г, х, и), Яр) + 2 gt ф‘(<. X, и).

( = 0

Здесь яр(<) — решение уравнения (16). Теперь условие (15) примет вид

^H[t, x(t), u(t), яр(0,?] bu>0, Vt, Vbut=Kr (17)

Оно означает, что функция H[t, x(t), и, яр(<), g], рассматриваемая как функция и в области U, в точке u(t) достигает локального минимума (максимума, если бы мы использовали для разделения конусов Kf и Kz вектор g' = —g). Это и есть простейший вариант принципа максимума. Он утверждает, что если траектория {*(•)> и(')} оптимальна (x(t) — решение задачи Коши X = f, соответствующее управлению «(•))> то существует вектор g, такой, что выполняется условие (17) экстремума H по и в области U.

Конечно, в приведенном выше выводе мы опустили некоторые элементы математической аккуратности, но основные содержательные соображения сохранены. Теория, основанная на использовании конечных вариаций управления на множествах малой меры (см. § 27), позволяет утверждать, что функция Гамильтона достигает не локального, а точного минимума (максимума) по и Є U именно в точке u(t). Неопределенные коэффициенты gt, входящие в Н, играют роль множителей Лагранжа.

Некоторые обобщения задачи. Выше был рассмотрен относительно простой вариант задачи оптимального управления. В дальнейшем мы рассмотрим и задачи, существенно от нее отличающиеся. Здесь же мы ограничимся простым, но полезным обобщением. Расширим управление, включив в него набор параметров р = {pv P2, ..., Pk], которые должны быть определены из тех же соображений, что* и и( ¦). Будем рассматривать систему уравнений вида

X = f(t, x(t), u(t), р), 0 ^t ^T, х(0)=Х0(р).

В функции Ф, входящие в описание стандартных конструкций функционалов, наряду с указанными ранее аргументами, может входить и вектор р.

Будем считать, что, задав обобщенное управление {и(¦),/>}, можно определить траекторию x(t) и вычислить значения всех функционалов, которые теперь следует обозначать как F[u(-), р]. Формула для вариации функционала при малом возмущении управ-
464 ПРИБЛИЖЕННЫЕ МЕТОДЫ ВЫЧИСЛИТЕЛЬНОЙ ФИЗИКИ [Ч. II

ления {ы(-)> р} -*¦ {“(') + 6u(-), P + очевидным образом обобщается:

т

F[u( •) + бы(-), р + 6р] я» F[u(-), р\ + J (w, Ьи) dt + (а, Ьр).

о

Вычисление производной a = dF[u(-), р]/др не требует новых сложных вычислений и осуществляется одновременно с вычислением w(t) (производной по w(¦)); см. §27.

Обратим внимание на то, что теперь задачу можно рассматривать на стандартном интервале времени 0 ^ t ^ I. В тех случаях, когда время процесса управления T не фиксировано и является вместе с и( •) «ресурсом оптимизации», можно перейти к системе х = Tf, включив T в качестве одной из компонент в вектор параметров. Если F0[u(¦), р] = Т, задача называется задачей оптимального быстродействия, так как целью является выполнение системой поставленной задачи за минимальное время.

Задачи с фазовыми ограничениями. Особенно сложным является приближенное решение задач оптимального управления, если среди требований к управлению поставлено условие невыхода траектории x(t) из некоторой заданной области. Рассмотрим простейший пример.

Пусть поставлено условие G[x(t) | < О, V t, где G — скалярная гладкая функция. Как уже было сказано, это условие можно оформить в терминах функционала: F[u( •)] = max G[x(<)]- Если,

t

как это часто случается,

|А = arg max G[x(<)]

t

есть не точка, а несколько точек или даже целый интервал, функционал оказывается недифференцируемым по Фреше. Однако он оказывается дифференцируемым по направлениям в функциональном пространстве, и можно написать почти очевидную (пока предварительную) формулу:

bF = max Gx[x(x)] 6х(х).

хЄ(і

Здесь Gx[x(x)] 6х(х) есть линейный функционал от вариации управления би(-), и мы знаем, как он вычисляется:

T

Gx[x(t)] 6х(т) = J (w(t, х), 6u(t)) dt. о
§28]

ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

465

Причины, приведшие к появлению в w еще одного аргумента т, понятны. Теперь мы имеем

T

6^[6и( )] = max J (w(t, т), 6u(t)) dt.

тЄ(і 0

Формально можно обобщить задачу поиска улучшающей вариации управления 6м(-), включив в нее еще и условия

T

G[x(x)] + J {w(t, т), bu(t)) dt*i О, V х Є (л.

о

Ho это не так просто, ведь этих условий очень много (континуум, если |А — отрезок, например).

Вычисление w(t, х) для каждого х Є |х требует своего отдельного интегрирования сопряженной системы. Однако здесь есть некоторые возможности облегчения ситуации: х(<) есть гладкая функция (де = /, / ограничена при всех и; следовательно, x(t) — непрерывная функция, с ограниченной кусочно-непрерывной производной). Такая функция не может очень сильно изгибаться. Поэтому если потребовать выполнения условия G[x(t)\ ^ 0 не во всех г Є [О, Г], а только в

узлах некоторой сетки !'(/ = 1,2, ..., У), то в остальных точках t оно будет, видимо, нарушено не очень сильно. Это соображение можно развивать и дальше, с тем чтобы число J было не слишком большим.

Пусть при каком-то и(-) найдена траектория x(t) и вычислена функция G[x(t) ]. Выделим на [О, T| множество |х условием
Предыдущая << 1 .. 175 176 177 178 179 180 < 181 > 182 183 184 185 186 187 .. 210 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed