УДК 519.71

ГАРАНТИРОВАННЫЕ ДЕЙСТВИЯ В МУЛЬТИАГЕНТНЫХ СИСТЕМАХ

Калинкина Ирина Геннадиевна1, Мансурова Альмира Амировна2
1Филиал ФГБОУ ВПО «Южно-Уральский государственный университет», г. Аше, Старший преподаватель кафедры общенаучных и экономических дисциплин
2Филиал ФГБОУ ВПО «Южно-Уральский государственный университет», г. Аше, Ассистент кафедры общенаучных и экономических дисциплин

Аннотация
Данная статья посвящена построению модели взаимодействия пары интеллектуальных агентов в рамках мультиагентной информационно-управляющей системы, с учетом неопределенности, вносимой в систему более простыми - реактивными агентами, действующими самостоятельно и не поддающимися контролю со стороны интеллектуальных агентов.

Ключевые слова: мультиагентные системы


GUARANTEED ACTIONS IN MULTIAGENT SYSTEMS

Kalinkina Irina Gennadievna1, Mansurovа Almira Amirovna2
1Branch of Federal state educational institution «the South-Ural state University, Ashe, Senior teacher of the Department of General scientific and economic disciplines
2Branch of Federal state educational institution «the South-Ural state University, Ashe, Assistant of the Department of General scientific and economic disciplines

Abstract
This article is devoted to the construction of the model of pair interaction of intelligent agents in the framework of the multi-agent information management system, taking into account the uncertainty introduced into the system more simple - reactive agents acting independently and beyond the control of intelligent agents.

Рубрика: 01.00.00 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

Библиографическая ссылка на статью:
Калинкина И.Г., Мансурова А.А. Гарантированные действия в мультиагентных системах // Современные научные исследования и инновации. 2013. № 12 [Электронный ресурс]. URL: http://web.snauka.ru/issues/2013/12/29147 (дата обращения: 02.06.2017).

Агентно-ориентированный подход 

Как показывают наблюдения специалистов, подтверждающие закон Мура, объем информации, содержащейся в информационно-аналитических системах, удваивается каждые 1,5 – 2 года. Соответствующими темпами растет сложность информационно-управляющих систем, разработка которых отнимает все большее количество как ресурсов, так и времени. Предложенный Шоэном [1] переход к агентно-ориентированному программированию и построению мультиагентных информационно-управляющих систем, дал возможность произвести качественный скачек, позволяющим преодолеть барьер сложности при разработке таких систем.

В теории мультиагентных систем обычно предполагается, что отдельный агент может иметь лишь частичное представление об общей задаче и способен решить только некоторую ее подзадачу. Поэтому для решения сколько-нибудь сложной проблемы, как правило, требуется взаимодействие агентов.

Под агентом понимается любая сущность, которая может воспринимать среду обитания (внешний мир) и воздействовать на нее. Данное понятие объединяет как натуральных (люди, животные, коллективы людей, группы организмов), так и искусственных (сложные программы, роботы, коллективы автоматов) агентов. Согласно Вуджриджу [2] любой агент обладает следующим набором базовых свойств:

- автономность- агент является самоуправляемым, самостоятельно контролирует свои действия и свое внутреннее состояние;

- реактивность – способность воспринимать состояние внешней среды и реагировать на ее изменения;

- коммуникативность – способность к взаимодействию с другими агентами;

- целенаправленность – у агента имеется некоторая цель и его поведение подчинено достижению этой цели. Близость к цели определяет оценочная функция агента.

По степени внутреннего представления внешнего мира и способу поведения агенты делятся на два класса: интеллектуальных (или когнитивных) и реактивных агентов. Реактивные агенты не имеют внутренней модели внешней среды, или эта модель крайне бедна. Они могут иметь лишь слабо выраженную индивидуальность, сильно зависят от окружающей среды и практически не способны планировать свои действия (которые все же вынуждены осуществлять). Интеллектуальные агенты обладают более богатым представлением внешней среды, что обусловлено наличием у них базы знаний и механизма анализа действий.

Модель взаимодействия агентов 

Рассмотрим модель взаимодействия пары интеллектуальных агентов в рамках мультиагентной информационно-управляющей системы, с учетом неопределенности, вносимой в систему более простыми – реактивными агентами, действующими самостоятельно и не поддающимися контролю со стороны интеллектуальных агентов. Интеллектуальным агентам не известны ни какие статистические характеристики возможных действий реактивных агентов, ни сами эти действия, известна только область их возможных проявлений. При этом:

во-первых, при выборе своих действий, агенты ориентируются не только на исходы (значения своих оценочных функций), но и на риски, соответствующие этим исходам;

во-вторых, в процессе принятия решения интеллектуальные агенты обмениваются информацией и согласовывают свои действия;

в-третьих, часть полученных в результате своих действий выигрышей (исходов) и рисков интеллектуальные агенты могут передавать друг другу.

Так подобного вида взаимодействия реализуются, например, в рамках биржевых торговых систем. Роль интеллектуальных агентов при этом играют корпоративные информационные системы, принадлежащие разным брокерам одного холдинга, планирующие и осуществляющие стратегические операции с ценными бумагами. А реактивные агенты здесь – многочисленные торговые роботы, осуществляющие в автоматическом режиме короткие операции покупок и продаж на фондовом рынке.

Статический вариант модели образует кортеж

,

где 1, 2 – номера интеллектуальных агентов, которые совместно и согласованно выбирают свои действия xi из множества всех возможных действий Xi агента i (i=1,2). В результате такого выбора складывается соглашение x=(x1,x2). Одновременно с этим и независимо от действий интеллектуальных агентов реализуется действие реактивных агентов y, о котором интеллектуальные агенты не имеют ни какой стохастической информации, им известна только область возможных значений этих действий Y На образовавшихся в результате парах (x, y)  X×Y определена скалярная оценочная функция i-го интеллектуального агента fi (x, y) : X×Y→R (i=1,2). Значение оценочной функции fi (x, y) на реализовавшемся (в результате действий интеллектуальных агентов) соглашении x и появившемся независимо действии реактивных агентов y есть предварительный исход i-го интеллектуального агента. Предварительным риском i-го интеллектуального агента будет вычисленное на этой же паре значение функции риска

   (i=1,2),

где xP (y) – максимальная по Парето альтернатива в двухкритериальной задаче

,

полученной из исходной модели при каждом фиксированном действии реактивных агентов yY.

Функция Фi (x, y) численно оценивает риск i-го интеллектуального агента, связанный с тем, что он выбрал свое действие из соглашения x, а не из xP (y), хотя последнее и доставляет максимум по Парето в Г(y).

Полученные таким образом суммарный предварительный исход f1 (x, y) + f2 (x, y)  и суммарный предварительный риск Ф1 (x, y) + Ф2 (x, y) интеллектуальные агенты в дальнейшем, путем переговоров, перераспределяют между собой. При этом исходы суммируются только с исходами, а риски – с рисками.

На “содержательном уровне” цель i-го интеллектуального агента состоит в согласованном выборе такого своего действия и такого перераспределения исходов и рисков, чтобы полученный в результате его перераспределенный исход стал возможно большим, а риск возможно меньшим. Одновременно с этим, интеллектуальные агенты должны ориентироваться на возможность реализации любого действия реактивных агентов yY.

Ниже применяются вектора f = (f1, f2), Ф = (Ф1, Ф2) и предполагается, что во-первых все максимумы и минимумы в следующем определении достигаются, а во-вторых функции fi (x, y) и Фi (x, y) (i=1,2) непрерывны на произведении непустых компактов X×Y; [φ(a)]=Idem[ab] далее означает выражение в скобках [ … ] в левой части равенства, где a заменено на b.

В [3] было формализовано понятие гарантированного по выигрышам и рискам решения, основанное на понятии векторной седловой точки [4].

Определение. Гарантированным по исходам и рискам решением (ГИРР) математической модели взаимодействия двух интеллектуальных агентов при неизвестных действиях реактивных агентов Г назовем тройку (x*, f*, Ф*), для которой существует действие реактивных агентов ypY такое, что выполняются следующие три условия:

10 условие коллективной рациональности

;

20 условие «неухудшаемости» суммарного исхода и риска

;

30 условие индивидуальной рациональности:

справедлива система из четырех неравенств

   (i=1,2),

где

;

при этом пара  назовем гарантированным векторным исходом, пару  - гарантированным векторным риском модели Г, а x* - соглашением, гарантирующим эти исходы и риски.

В работе [3] исследованы свойства указанного решения, а в [5] найдены условия существования ГИРР в смешанном расширении модели. А именно

Теорема. Пусть в модели Г

1)      множества Xi (i=1,2) и Y – непустые компакты;

2)      оценочные функции fi (x, y) и функции риска Фi (x, y) (i=1,2) непрерывны на X×Y.

Тогда в модели Г существует гарантированное по исходам и рискам решение в смешанных действиях интеллектуальных и реактивных агентов.

Один из способов перераспределения выигрышей и рисков между агентами указан в [6].

Недостатком такого подхода является «неустойчивость» ГИРР. Это вызвано тем, что игроки ориентируются на  реализацию конкретного значения неопределенности  ypY, но шансы такой  реализации в конкретной партии игры ничтожно малы. А при реализации любой другой неопределенности, отличной от указанной в определении, условия коллективной и индивидуальной рациональности могут нарушаться.

По нашему мнению, предпочтительнее является подход к формализации гарантированного решения, основанный на аналоге максимина [7]. Для решения, построенного как аналог максимина, при любой реализации неопределенности будут выполнены условия коллективной и индивидуальной рациональности.


Библиографический список
  1. Shoham Y. Agent Oriented Programming // Artificial Intelligence. – 1993. – Vol.60, №1. – P.51-92.
  2. Wooldridge M.Intelligent Agents: Theory and Practice / Wooldridge M., Jennings N. // The Knowledge Engineering Review. – 1995. – Vol.10, №2. – P.115-152.
  3. Жуковский В.И., Кудрявцев К.Н. Одна кооперативная игра с побочными платежами и учетом рисков // Spectral and evolution problems: Proceedings of the Sixteenth Crimean Autumn Mathematical School-Symposium (KROMSH-2005). – 2006. – V.16. – P. 142-148.
  4. Жуковский В.И. Введение в дифференциальные игры при неопределенности. М.: Международный НИИ проблем управления, 1997.
  5. Кудрявцев К.Н. О существовании гарантированных по выигрышам и рискам решений в кооперативных играх при неопределенности // Системы управления и информационные технологии, 1.1(39), 2010. – С. 148-15.
  6. Кудрявцев К.Н. Побочные платежи в одной кооперативной игре с учетом рисков // Вестник Южно-Уральского государственного университета.  Серия: Математика. Механика. Физика. 2011. №10 (227), С. 25 – 28.
  7. Жуковский В.И., Кудрявцев К.Н. Уравновешивание конфликтов при неопределенности. II. Аналог максимина // Математическая Теория Игр и ее Приложения. 2013. Т. 5, № 2. C. 3-45.


Все статьи автора «IrinaAlmira»


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте или через форму обратной связи.

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться: