Главная > Математика > Дифференциальные игры
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ПРЕДИСЛОВИЕ

Когда собака гонится за кроликом, то даже если она все время видит его, она не знает его дальнейшего поведения и может руководствоваться лишь знанием физических возможностей кролика и своих собственных. Таково своеобразие задачи преследования одного управляемого объекта другим управляемым объектом, математическому изучению которой посвящена настоящая книга. Конечно, здесь речь идет не о животных, а о технических объектах, но у этих объектов предполагается некоторая свобода действий, аналогичная свободе воли животных. Заранее нужно сказать, что рассматриваемые книге технические объекты чрезвычайно элементарны, и весь вопрос ввиду его новизны находится еще на очень низком уровне развития. В книге изучаются игры, в которых участвуют два игрока: убегающий и преследователь. Такие игры преследования Айзеке назвал дифференциальными потому, что в них поведение обоих игроков описывается дифференциальными уравнениями. Перейдем, однако, к точным формулировкам.

Объект называется управляемым, если его состояние определяется вектором некоторого фазового векторного пространства, а движение описывается векторным дифференциальным уравнением

где вектор, определяющий состояние объекта, производная вектора х по времени, а и — управляющий параметр, который, вообще говоря, является не числом, а точкой некоторого множества. Уравнение (1) задает не конкретное движение объекта, а его технические возможности. Это объясняется наличием в уравнении (1) управляющего параметра и, в котором

воплощается свобода воли объекта. По мере течения времени управляющий параметр тем или иным способом получает определенные значения и в конечном счете становится известной функцией времени, так что уравнение (1) можно решать.

В частном случае, когда мы имеем дело с механическим объектом, часть координат вектора х определяет геометрическое положение объекта, а остальные координаты задают скорости изменения геометрических координат.

В задаче о преследовании рассматриваются два объекта: объект х с уравнением (1) и объект у с уравнением

имеющий, вообще говоря, другое фазовое пространство и с другим управляющим параметром Задача преследования состоит в том, что убегающий объект у движется согласно своим техническим возможностям, т. е. в силу уравнения (2), в каждый момент времени используя свою свободу воли (свободу выбора параметра а объект х стремится как можно скорее догнать у, двигаясь в силу уравнения (1) и используя всю свою свободу воли для быстрейшей поимки объекта у, при этом объект х в каждый момент времени знает лишь свое состояние, состояние объекта у в тот же момент времени и, быть может, значение управляющего параметра но он ни в коем случае не может знать дальнейшего поведения у. Преследование считается завершенным в момент, когда объекты х и у геометрически совпадут, т. е. тогда, когда геометрические координаты вектора х станут равными геометрическим координатам вектора у. В книге Айзекса, впрочем, вопрос ставится несколько иначе, но об этом ниже.

При разборе задачи преследования удобно объединить оба вектора х и у в один вектор т. е. составить прямую сумму фазовых пространств обоих объектов; тогда совокупность уравнений (1) и (2) можно записать в виде одного векторного уравнения

В фазовом пространстве совокупность всех точек z, в которых игра преследования считается завершенной, составляет некоторое многообразие Теперь мы можем сформулировать значительно более общую задачу, чем задача преследования, которая и называется дифференциальной игрой.

В некотором векторном пространстве задано дифферент циальное уравнение (3), правая часть которого зависит от двух управляющих параметров и и и; кроме того, в пространстве задано многообразие произвольной размерности. Игра состоит в том, что по мере течения времени каким-то способом задаются значения управляющего параметра а значения управляющего параметра и выбираются в каждый момент времени так, чтобы закончить игру по возможности быстро. Игра считается законченной, когда вектор z оказывается принадлежащим многообразию

Здесь наличие двух игроков выражается в наличии двух управляющих параметров С исходной задачей — игрой преследования — связано также предположение, что правая часть уравнения (3) распадается в сумму двух слагаемых, одно из которых зависит только от управляющего параметра и, а другое — только от управляющего параметра

Методика Айзекса требует, чтобы размерность многообразия была в точности на единицу меньше размерности пространства В связи с этим ограничением ему приходится считать, что преследование завершено не тогда, когда объекты геометрически совпали, а тогда, когда расстояние между ними стало равно некоторому положительному числу. В такой постановке задачи преследования есть свои плюсы и свои минусы.

В предлагаемой вниманию читателей книге Айзекса нет общих теорем. Она содержит лишь некоторые общие соображения и разбор на основе эгих соображений многочисленных конкретных задач. Это связано с тем, что вопрос находится еще в начальной стадии своего развития.

Книга Айзекса представляет собой сводку его работ, опубликованных в закрытой печати, так что работы эти не были

ранее доступны советскому читателю. Однако введенный Айзексом термин «дифференциальная игра» дошел до Советского Союза и стал употребляться советскими математиками. В частности, и я воспользовался им, еще не имея никакого представления о работах Айзекса.

Дифференциальные игры открывают новую интересную тематику для исследований и в перспективе своего дальнейшего развития приведут к решению актуальных технических задач.

Л. С. Понтрягин, 1 января 1967 г.

ОТ РЕДАКТОРА ПЕРЕВОДА

Автор любезно предоставил в наше распоряжение целый ряд добавлений и исправлений к английскому тексту книги, за что редакция очень ему признательна. Кроме того, в процессе перевода были устранены некоторые неточности.

В конце книги помещено приложение — обзор некоторых результатов по теории дифференциальных игр. Обзор снабжен большим списком литературы.

М И. Зеликин.

ПРЕДИСЛОВИЕ АВТОРА К РУССКОМУ ИЗДАНИЮ

Я получил большое удовлетворение, когда узнал, что мои исследования пустили корни в плодородной научной почве Советского Союза. Эта страна вправе гордиться своими свершениями, и, по-видимому, в будущем она неизбежно будет все чаще играть роль научного инициатора.

Мои работы по дифференциальным играм были впервые опубликованы в шести выпусках «Rand Reports» в период с 1951 по 1953/54 г., когда вышла заключительная серия из четырех работ. Выпущенные ограниченным тиражом, они тем не менее имели некоторое хождение в Соединенных Штатах, но, насколько я знаю, ни один из выпусков не достиг Советского Союза. Других источников информации, по-видимому, не было. Эта книга могла выйти в свет на много лет раньше, если бы мне удалось раньше получить необходимые субсидии.

Тем временем вышеупомянутые выпуски «Rand Reports» и мои неофициальные лекции в Rand Corporation (около 1950 г.) дали неожиданные плоды. Стала развиваться теория дифференциальных игр с одним игроком, которая получила название теории управления. С тех пор эта теория чрезвычайно разрослась; появились посвященные ей журналы, стали проводиться международные конференции, и ею начали заниматься многие ученые. Среди них одно из основных мест занимали советские ученые. Некоторые из них — Л. С. Понтрягин, А. М. Лётов, Р. В. Гамкрелидзе, Л. А. Петросян и другие — в настоящее время проявляют серьезный интерес к задаче с двумя игроками. Итак, теория дифференциальных игр появилась независимо в Советском Союзе в качестве обобщения теории управления; в моей стране наблюдался обратный процесс. Когда писалась книга, я не знал об этих направлениях, поэтому читатель должен быть готов

найти много отличий в деталях и обозначениях от того, что стало теперь стандартным.

Между «принципом перехода» и принципом максимума Понтрягина параллели, несомненно, должны существовать; имеются и некоторые различия; например, я стараюсь избегать таких постановок задач в играх преследования, когда захватом называется совпадение точек.

В настоящее время я предоставляю другим выяснение связей между двумя этими версиями по существу одного и того же круга идей.

Руфус Айзеке, Арлингтон, Виргиния, США, 1966 г.

ИЗ ПРЕДИСЛОВИЯ К АМЕРИКАНСКОМУ ИЗДАНИЮ

Хотя первой причиной, побудившей меня взяться за книгу, были задачи военного характера, постепенно тематика книги отошла далеко от этих задач. В результате получилось математическое исследование, представляющее собой своеобразный сплав теории игр, теории управления и вариационного исчисления, причем в результате такого объединения появились элементы, новые по отношению ко всем трем этим наукам.

Возникавшие проблемы, как правило, требовали новых методов. Для их решения понадобилась новая теория, представляющая по существу основное содержание этой книги.

Она выкристаллизовалась в процессе решения конкретных задач. При рассмотрении многих из них пришлось столкнуться с новыми, на первый взгляд непонятными явлениями, причем, как только удавалось разобраться в одних, появлялось много новых, столь же непонятных. Невозможно предсказать все захватывающие неожиданности, которые может повлечь за собой развитие теории дифференциальных игр. На пути развития этой теории новые затруднения, по-видимому, никогда не перестанут появляться, и поэтому нелегко определить, до какой степени она сейчас завершена.

Читателю, который хочет только ознакомиться с настоящей теорией, я предложил бы следующий порядок чтения книги.

В гл. 1 говорится о природе дифференциальных игр, а также очерчена область явлений, которые можно описать дифференциальными играми. Здесь изложены некоторые типичные задачи, однако ничего не говорится о методах их решения.

Идею таких методов можно почерпнуть из гл. 3, посвященной дискретным моделям; некоторые из них представляют собой квантованные варианты непрерывных задач. Поскольку их

можно решать шаг за шагом, читатель сможет понять сущность нашего подхода к решению задач без формальных математических приемов.

В гл. 2 переводятся на математический язык понятия, содержащиеся в первой главе; однако в сущности основные положения теории изложены начиная с гл. 4. Таким образом, чтения гл. 1 и 3 и беглого просмотра гл. 2 достаточно для первого ознакомления с теорией дифференциальных игр.

Читатель, интересующийся приложением теории к вопросам военного дела, после такого предварительного чтения или сразу же может обратиться к гл. 11. Часть задач, также имеющих отношение к военному делу, изложена в предыдущих главах, однако для понимания их требуется последовательное чтение текста.

Возможно, что отсутствие теорем существования и единственности покажется некоторым ересью. Мне кажется, в данном случае будет правильным уделить основное внимание особенностям конкретных задач вопреки общепринятой математической тенденции. Без этого трудно понять, как можно объяснить многие новые явления, с которыми приходится сталкиваться теории. Кроме того, большое разнообразие этих явлений устраняет вопрос о теоремах существования и единственности; в самом деле, как бы громоздки они ни были, эти теоремы не могут охватить всех возможных случаев. Области приложений оказались гораздо разнообразнее, чем я думал вначале; читатель может в этом убедиться, просмотрев книгу.

После первых публикаций [1], пересмотренный материал которых составляет теперь гл. 1—4, прошло несколько лет, в течение которых мне не удалось уделить дифференциальным играм достаточно времени.

Я вернулся к этой тематике, лишь когда стал работать в Авиационной компании Хьюза в связи с проблемой избежания столкновений. Теория избежания столкновений самолетов и судов оказывается гораздо более трудной, чем это можно ожидать вначале. Серия происшедших катастроф ускорила наши исследования. При этом обнаружилась неожиданная и изящная связь этой проблемы с дифференциальными играми. Проблема избежания столкновений относится к типу игр, где участники не

преследуют противоположные цели, а кооперируются; она подчинена тем же математическим принципам, обеспечивающим «мак-симакс» вместо «минимакса». Недостаток места не позволяет включить в книгу полученные результаты по этому вопросу; они будут помещены в отдельных статьях.

Настоящая работа представляет собой оригинальное исследование. Однако неизбежная задержка публикаций, по-видимому, заставила потускнеть блеск ее новизны. Как это часто случается в истории науки, одни и те же концепции возникают в соответствующее время одновременно и независимо у различных исследователей. Долгое время я занимался этой проблемой один и не подозревал, что в это же время она развивается другими авторами.

Действительно, через несколько дней после завершения работы над рукописью (в марте 1963 г.) я впервые увидел книгу Понтрягина и др. [2], где изложен подход к проблемам минимизации, аналогичный предлагаемому здесь. Этот подход применим для исследования игр одного игрока. В диссертации Келенджеридзе [3] этот метод распространен на игры двух игроков, и поэтому в некоторых отношениях его работа совпадает с моей.

Кроме советских, появились американские публикации [4], посвященные в основном логическим обоснованиям дифференциальных игр. Берковиц применяет вариационное исчисление к стратегиям одного игрока, считая, что стратегия его противника временно фиксирована. Флеминг определяет непрерывную стратегию как лежащую между двумя дискретными. Эти интересные работы появились слишком поздно для того, чтобы их можно было использовать в настоящей книге.

Однако одновременно с этой развивалась другая самостоятельная теория, терминология которой столь сильно отличалась от терминологии теории игр, что при написании этой книги я не подозревал их сходства. Теория оптимального управления [5] идентична дифференциальным играм одного игрока и поэтому является частным случаем таких игр. Я заменил два термина из «Rand Reports» на используемые в настоящей книге термины фазовые координаты и управления, принятые в теории управления. Поверхности переключения в этой теории аналогичны

сингулярным поверхностям в дифференциальных играх Вопрос об управляемости (каких состояний можно достичь из заданного начального состояния?) - основной вопрос в так называемых играх качества (гл 8 и 9). Таким образом, обе эти теории дополняют друг друга задачи оптимального управления можно превратить в дифференциальные игры, если ввести еще одного участника, а изложенные здесь методы можно применять к задачам управления, рассматривая их как игры одного игрока Тем не менее я сохранил в общем случае для игроков названия преследующий и убегающий, порожденные рассматриваемыми вначале играми преследования, я упоминаю об эгом для того, чтобы у читателя не сложилось впечатления, будто в книге рассматриваются только такие игры

Р. Айзеке, Вашингтон Октябрь 1964 г

<< Предыдущий параграф Следующий параграф >>
Оглавление