Главная > Математика > Дифференциальные игры
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.7. ИНТЕГРАЛЬНЫЕ ОГРАНИЧЕНИЯ

Материал этого параграфа мы будем использовать лишь в дополнении

В классическом вариационном исчислении встречаются задачи, где траектории таковы, что один или несколько из данных интегралов должны иметь некоторое заданное постоянное значение В общем виде это условие выглядит так

интеграл здесь берется вдоль траектории от начальной точки до 5

Мы будем рассматривать задачи с одним только ограниче нием типа (5 7 1), обобщение на большее количество таких ограничений очевидно

Введем новую фазовую координату и добавим к уравнениям движения уравнение

Новая терминальная поверхность совпадает с прежней, и для нее Следуя обычному своему методу, отбрасываем все начальные точки, кроме тех, которые лежат на плоскости Условие (5 7 1) будет выполнено, и наш метод позво лит найти минимакс относительно и -стратегий при этом ограничении Часто новая терминальная поверхность будет иметь недостаточную размерность Тогда мы будем, как обычно (см § 2 3), окружать терминальную кривую окрестностью, использовать границу этой окрестности как а затем исследовать предельный случай при

Однако более логичным кажется следующий подход. Мы вводили -окрестность для того, чтобы получить на ней начальные значения Но можно сделать это непосредственно, приняв

где параметр, который задает семейство траекторий, исхо дящих из (размерность поверхности равна поэтому не может определять n-параметрическое семейство траекторий в -мерном пространстве) Уравнение (5 7 3) вместе с обычными начальными устовиями (на

и основным уравнением (4.2.3) дает систему уравнений, которую нужно решать относительно функций от

В расширенной системе уравнений движения входит лишь в одно из них, а именно в (5.7.2). Следовательно, одно из уравнений характеристик в регрессивной форме имеет вид

Отсюда следует, что вдоль оптимальной траектории X остается постоянным и равным своему значению на

Преимущество такого подхода заключается в возможности с его помощью рассматривать задачи несколько иного типа. Часто ограничение (5.7.1) нас интересует лишь как крайний случай; по смыслу задачи должно выполняться условие

На практике это случается, скажем, когда имеется ограниченный запас (горючего, времени и т. д.), который один из игроков не может перерасходовать. Обычно оптимальная стратегия предписывает игроку использовать весь запас, распределяя его определенным образом; тогда, чтобы задать такое ограничение, достаточно условия (5.7.1), хотя критерий (5.7.5) более точно описывает ситуацию

Встречаются, однако, случаи, когда слишком большой расход запасов, хотя и дозволенный ограничением, нежелателен. В самом деле, с точки зрения минимизирующего игрока это имеет место, когда, скажем, в некоторой точке

С учетом (5.7.3) и (5 7.4) последнее неравенство означает, что в этой точке Следовательно, мы добиваемся оптимального расходования ресурсов, налагая на начальные условия ограничение

Разумеется, если интеграл должен быть больше или равен С и не может быть меньше, рассматривается ограничение

Поясним все это простым наглядным примером Пусть а в качестве уравнений движения возьмем

Тогда основное уравнение (4.2.3) примет вид

где черта над буквой означает, что здесь обычные выступают как аргументы. На рис. 5.7.1, а показана поверхность на ней здесь же нарисованы оптимальные траектории в предположении, что решение получено нашим обычным методом. Точки плоскости над образуют

Рис. 5.7.1.

Рассмотрим теперь другую игру, которая возникает из этой, если мы учитываем ограничение, заданное равенством (5.7.1). К уравнениям движения добавляется

а основное уравнение становится таким:

Заметим, что которые теперь уже являются функциями от не обязательно такие, как в (5.7.7); то же можно сказать и о функциях

На рис. 5.7.1,6 изображено пространство для новой игры. Новая терминальная поверхность лежит в плоскости и совпадает там со старой:

Новое пространство состоит из точек, лежащих над поверхностью, которая получается сдвигом на u, т. е. таких точек (х, у, u), что х и у принадлежат пространству прежней игры, а

Множество точек , для которых х, у принадлежат прежнему обозначим через Оно состоит из тех начальных точек, которые удовлетворяют условию (5.7.1).

В качестве начальных условий теперь используем (5.7.9), значения полученные при решении системы

и новое основное уравнение (5.7.8) с учетом (5.7 9).

Решая с этими начальными условиями систему уравнений характеристик в регрессивной форме, полученную из прежней добавлением уравнений находим семейство траекторий, исходящих из и зависящих от двух параметров Таким образом, из каждой точки кривой исходит семейство траекторий и каждому X соответствует одна из них. Можно ожидать, что траектории встречают на подмножестве как это показано на рис.

Предположим, мы ищем решение задачи, для которого условие (5.7.1) должно выполняться в начальной точке Тогда сначала найдем соответствующую точку С- Если она лежит на то проходящая через нее траектория будет оптимальной для расширенной задачи, а проекция этой траектории на плоскость будет оптимальной траекторией для игры в первоначальном пространстве.

Если же точка лежит вне то оптимальная траектория отсутствует, что означает, что в первоначальном пространстве игры невозможно из этой точки достичь не нарушая условия (5.7.1). Практически границу области обычно можно считать предельной кривой в ей соответствует

Заметим, что для начальной точки на кривой в для ко торой оптимальная стратегия та же самая, что и в первоначальной игре без ограничения (5.7.1). В самом деле, если то ясно, что равенство (5.7.1) не вносит никаких изменений в формальные выкладки. Траектории, для которых изображены на рис а на рис. 5.7.1, а показаны их проекции на плоскость

Рассмотрим теперь случай, где требуется выполнение условия типа (5.7 5). Будем считать, что в невырожденной игре двух игроков это требование предъявляется лишь к одному из них. В противном случае можно ожидать, что второй игрок нарушит это условие, а тогда для сохранения смысла игры он должен получить некоторую выгоду в плате, это привело бы к существенной переделке первоначальной постановки задачи

Очевидно, что такое допущение выполняется во многих практических случаях. Например, если один из игроков управляет движущимся объектом, ограничивающий интеграл может задавать его область движения или запас горючего, расходом которого распоряжается только этот игрок. Для определенности будем считать, что такому ограничению подчинен минимизирующий игрок

Рис. 5.7.2.

Обозначим через множество допустимых начальных точек. Иными словами, множеству принадлежат точки, для которых

поскольку для таких и только для таких точек

Это множество ограничено поверхностью на которой (см. рис. 5.7.2, а). Поверхность пересекается с плоскостью по кривой а с плоскостью по кривой, которую обозначим Ориентацию будем предполагать такой, чтобы для рис. 5.7.2, а X было отрицательным под и положительным над

Предположим теперь, что в задаче без ограничения игра начинается в точке В задаче с ограничением в качестве начальной точки можно взять любую точку в лежащую на горизонтальной прямой Оптимальной будет та точка, для которой V имеет наименьшее значение. Предположим сначала, что точка лежит в с под

кривой Тогда проведенная через нее горизонтальная прямая пересекает в точке К. Из уравнений движения, и начального условия получаем, что на всем На рис. 5.7.2, б показано изменение V вдоль этой линии. Действительно, справа от точки К производная положительна, в точке К равна нулю и т. д. Следовательно, минимум достигается в точке К, и она должна быть начальной точкой при оптимальной игре. Поскольку в этой точке

оптимальная траектория должна быть такой же, как если бы не было ограничения, так что может не учитывать его.

Если лежит в выше то на горизонтальной прямой

и тогда наилучшей начальной точкой будет та, у которой Если же точка лежит на то оптимальной будет траектория, для которой Здесь ограничение выполняется точно и без ущерба для платы. Итак, можно сделать следующее заключение.

Если при рассмотрении игры с ограничением в расширенном фазовом пространстве оказывается, что в некоторой начальной точке то исходящая из нее оптимальная траектория совпадает с оптимальной траекторией в первоначальной игре без ограничения; но если эти траектории различны

Заметим, что в случае, когда максимизирующий игрок связан интегральным ограничением, это утверждение остается справедливым, если в расширенной системе уравнений движения принять

Проблема 6.3.1. Каковы формальные обоснования требования, чтобы интеграл зависел от поведения только одного игрока?

В качестве примера рассмотрим простые классические задачи изопериметрического типа. Это задачи максимизации площади, ограниченной (или частично ограниченной) кривой заданной длины с различными условиями на концах. В каждом учебнике вариационного исчисления приводится задача о максимизации площади, лежащей ниже кривой заданной длины, соединяющей две точки верхней полуплоскости.

Пример 5.7.1. Классическая изопериметрическая задача. Чтобы сформулировать и решить задачу в принятых здесь терминах, будем считать, что кривая описывается движущейся точкой, скорость которой по модулю равна единице. Уравнения движения имеют вид

Площадь под этой кривой равна поэтому в качестве берем функцию

Поскольку скорость единичная, длина дуги, которую описывает точка, совпадает с величиной времени движения; поэтому в условии (5.7.1) надо взять Добавочным уравнением движения будет

Основное уравнение (4.2.1) примет вид

Обозначив

получим

и основное уравнение (4.2.3)

Уравнениями характеристик в регрессивной форме будут тогда

Ясно, что любая траектория, удовлетворяющая этой системе, является дугой некоторой окружности, ибо постоянны, а из основного уравнения (4.2.3) следует, что и постоянно. Тогда, решая подсистему линейных дифференциальных уравнений

для получаем, что

Наконец отметим, что, как следует из уравнений характеристик, х отличается от на константу.

Чтобы показать, как определяются начальные условия, возьмем в качестве первоначального множества прямую где и будем рассматривать начальные точки, для которых Нам нужно найти кривую заданной длины проведенную из точки в некоторую точку на и охватывающую максимальную площадь снизу от нее. Итак, в новой игре есть

На ней (поскольку на и

В соответствии с вышесказанным ограничимся рассмотрением случая

Тогда, используя основное уравнение (4.2.3), получаем, что

Так как из физического смысла траекторий следует, что то первое уравнение характеристик дает на Тогда к начальным условиям добавляется еще

Преобразовав проинтегрированные уравнения характеристик, получаем

Ясно, что найденная кривая является дугой окружности радиуса к с центром на и ординатой Очевидно, что если значение лежит в разумных пределах, найдется только одна такая дуга длины оканчивающаяся в точке и пересекающая над центром окружности. А это и есть хорошо известный классический результат.

Из основного уравнения (4.2.3) с очевидностью следует, что

т. е. мы никогда не теряем площади из-за слишком большой длины.

Если достаточно велико, мы должны отдавать себе отчет в том, что наша постановка задачи не запрещает точке делать более одного цикла в своем движении по круговой оптимальной траектории. Площадь, разумеется, подсчитывается с учетом знака, как при обычных вычислениях.

Рассмотрим, наконец, предельный случай при Легко видеть, что тогда уравнения (5.7.11) превращаются в

Эти уравнения соответствуют начальным точкам, расстояние которых от равно так что задача выбора оптимальной траектории здесь отсутствует.

Упражнение 5.7.1. Решить классическую изопериметрическую задачу для случая, когда искомая кривая должна соединять две заданные точки в верхней полуплоскости. (Окружить одну из точек, скажем окружностью малого радиуса для получения

Задача 5 7.1. Сделать из задачи предыдущего упражнения игру двух игроков, заставив второго игрока перемещать точку простым движением со скоростью, меньшей единицы. Длина кривой все время должна оставаться равной Цель минимизировать площадь под кривой или хотя бы сделать невозможным для максимизировать ее.

Трудно извлечь что-нибудь новое из такой хорошо изученной темы, как рассмотренная изопериметрическая задача. Но следующая задача отличается от классических вариантов тем, что содержит меньше условий на концах.

Задача 5.7.2 Найти кривую (или кривые), максимизирующую площадь под ней, если выполняется одно из следующих условий:

1) задана только длина кривой

2) задана одна из конечных точек.

Проблема Показать, что с точностью до произвольного постоянного множителя (возможно, ±1) введенное в этом параграфе совпадает с множителем Лагранжа в классическом вариационном исчислении.

<< Предыдущий параграф Следующий параграф >>
Оглавление