Агентно-ориентированный подход
Как показывают наблюдения специалистов, подтверждающие закон Мура, объем информации, содержащейся в информационно-аналитических системах, удваивается каждые 1,5 – 2 года. Соответствующими темпами растет сложность информационно-управляющих систем, разработка которых отнимает все большее количество как ресурсов, так и времени. Предложенный Шоэном [1] переход к агентно-ориентированному программированию и построению мультиагентных информационно-управляющих систем, дал возможность произвести качественный скачек, позволяющим преодолеть барьер сложности при разработке таких систем.
В теории мультиагентных систем обычно предполагается, что отдельный агент может иметь лишь частичное представление об общей задаче и способен решить только некоторую ее подзадачу. Поэтому для решения сколько-нибудь сложной проблемы, как правило, требуется взаимодействие агентов.
Под агентом понимается любая сущность, которая может воспринимать среду обитания (внешний мир) и воздействовать на нее. Данное понятие объединяет как натуральных (люди, животные, коллективы людей, группы организмов), так и искусственных (сложные программы, роботы, коллективы автоматов) агентов. Согласно Вуджриджу [2] любой агент обладает следующим набором базовых свойств:
- автономность- агент является самоуправляемым, самостоятельно контролирует свои действия и свое внутреннее состояние;
- реактивность – способность воспринимать состояние внешней среды и реагировать на ее изменения;
- коммуникативность – способность к взаимодействию с другими агентами;
- целенаправленность – у агента имеется некоторая цель и его поведение подчинено достижению этой цели. Близость к цели определяет оценочная функция агента.
По степени внутреннего представления внешнего мира и способу поведения агенты делятся на два класса: интеллектуальных (или когнитивных) и реактивных агентов. Реактивные агенты не имеют внутренней модели внешней среды, или эта модель крайне бедна. Они могут иметь лишь слабо выраженную индивидуальность, сильно зависят от окружающей среды и практически не способны планировать свои действия (которые все же вынуждены осуществлять). Интеллектуальные агенты обладают более богатым представлением внешней среды, что обусловлено наличием у них базы знаний и механизма анализа действий.
Модель взаимодействия агентов
Рассмотрим модель взаимодействия пары интеллектуальных агентов в рамках мультиагентной информационно-управляющей системы, с учетом неопределенности, вносимой в систему более простыми – реактивными агентами, действующими самостоятельно и не поддающимися контролю со стороны интеллектуальных агентов. Интеллектуальным агентам не известны ни какие статистические характеристики возможных действий реактивных агентов, ни сами эти действия, известна только область их возможных проявлений. При этом:
во-первых, при выборе своих действий, агенты ориентируются не только на исходы (значения своих оценочных функций), но и на риски, соответствующие этим исходам;
во-вторых, в процессе принятия решения интеллектуальные агенты обмениваются информацией и согласовывают свои действия;
в-третьих, часть полученных в результате своих действий выигрышей (исходов) и рисков интеллектуальные агенты могут передавать друг другу.
Так подобного вида взаимодействия реализуются, например, в рамках биржевых торговых систем. Роль интеллектуальных агентов при этом играют корпоративные информационные системы, принадлежащие разным брокерам одного холдинга, планирующие и осуществляющие стратегические операции с ценными бумагами. А реактивные агенты здесь – многочисленные торговые роботы, осуществляющие в автоматическом режиме короткие операции покупок и продаж на фондовом рынке.
Статический вариант модели образует кортеж
где 1, 2 – номера интеллектуальных агентов, которые совместно и согласованно выбирают свои действия xi из множества всех возможных действий Xi агента i (i=1,2). В результате такого выбора складывается соглашение x=(x1,x2). Одновременно с этим и независимо от действий интеллектуальных агентов реализуется действие реактивных агентов y, о котором интеллектуальные агенты не имеют ни какой стохастической информации, им известна только область возможных значений этих действий Y На образовавшихся в результате парах (x, y) X×Y определена скалярная оценочная функция i-го интеллектуального агента fi (x, y) : X×Y→R (i=1,2). Значение оценочной функции fi (x, y) на реализовавшемся (в результате действий интеллектуальных агентов) соглашении x и появившемся независимо действии реактивных агентов y есть предварительный исход i-го интеллектуального агента. Предварительным риском i-го интеллектуального агента будет вычисленное на этой же паре значение функции риска
где xP (y) – максимальная по Парето альтернатива в двухкритериальной задаче
полученной из исходной модели при каждом фиксированном действии реактивных агентов yY.
Функция Фi (x, y) численно оценивает риск i-го интеллектуального агента, связанный с тем, что он выбрал свое действие из соглашения x, а не из xP (y), хотя последнее и доставляет максимум по Парето в Г(y).
Полученные таким образом суммарный предварительный исход f1 (x, y) + f2 (x, y) и суммарный предварительный риск Ф1 (x, y) + Ф2 (x, y) интеллектуальные агенты в дальнейшем, путем переговоров, перераспределяют между собой. При этом исходы суммируются только с исходами, а риски – с рисками.
На “содержательном уровне” цель i-го интеллектуального агента состоит в согласованном выборе такого своего действия и такого перераспределения исходов и рисков, чтобы полученный в результате его перераспределенный исход стал возможно большим, а риск возможно меньшим. Одновременно с этим, интеллектуальные агенты должны ориентироваться на возможность реализации любого действия реактивных агентов yY.
Ниже применяются вектора f = (f1, f2), Ф = (Ф1, Ф2) и предполагается, что во-первых все максимумы и минимумы в следующем определении достигаются, а во-вторых функции fi (x, y) и Фi (x, y) (i=1,2) непрерывны на произведении непустых компактов X×Y; [φ(a)]=Idem[a→b] далее означает выражение в скобках [ … ] в левой части равенства, где a заменено на b.
В [3] было формализовано понятие гарантированного по выигрышам и рискам решения, основанное на понятии векторной седловой точки [4].
Определение. Гарантированным по исходам и рискам решением (ГИРР) математической модели взаимодействия двух интеллектуальных агентов при неизвестных действиях реактивных агентов Г назовем тройку (x*, f*, Ф*), для которой существует действие реактивных агентов ypY такое, что выполняются следующие три условия:
10 условие коллективной рациональности
20 условие «неухудшаемости» суммарного исхода и риска
30 условие индивидуальной рациональности:
справедлива система из четырех неравенств
где
при этом пара назовем гарантированным векторным исходом, пару - гарантированным векторным риском модели Г, а x* - соглашением, гарантирующим эти исходы и риски.
В работе [3] исследованы свойства указанного решения, а в [5] найдены условия существования ГИРР в смешанном расширении модели. А именно
Теорема. Пусть в модели Г
1) множества Xi (i=1,2) и Y – непустые компакты;
2) оценочные функции fi (x, y) и функции риска Фi (x, y) (i=1,2) непрерывны на X×Y.
Тогда в модели Г существует гарантированное по исходам и рискам решение в смешанных действиях интеллектуальных и реактивных агентов.
Один из способов перераспределения выигрышей и рисков между агентами указан в [6].
Недостатком такого подхода является «неустойчивость» ГИРР. Это вызвано тем, что игроки ориентируются на реализацию конкретного значения неопределенности ypY, но шансы такой реализации в конкретной партии игры ничтожно малы. А при реализации любой другой неопределенности, отличной от указанной в определении, условия коллективной и индивидуальной рациональности могут нарушаться.
По нашему мнению, предпочтительнее является подход к формализации гарантированного решения, основанный на аналоге максимина [7]. Для решения, построенного как аналог максимина, при любой реализации неопределенности будут выполнены условия коллективной и индивидуальной рациональности.
Библиографический список
- Shoham Y. Agent Oriented Programming // Artificial Intelligence. – 1993. – Vol.60, №1. – P.51-92.
- Wooldridge M.Intelligent Agents: Theory and Practice / Wooldridge M., Jennings N. // The Knowledge Engineering Review. – 1995. – Vol.10, №2. – P.115-152.
- Жуковский В.И., Кудрявцев К.Н. Одна кооперативная игра с побочными платежами и учетом рисков // Spectral and evolution problems: Proceedings of the Sixteenth Crimean Autumn Mathematical School-Symposium (KROMSH-2005). – 2006. – V.16. – P. 142-148.
- Жуковский В.И. Введение в дифференциальные игры при неопределенности. М.: Международный НИИ проблем управления, 1997.
- Кудрявцев К.Н. О существовании гарантированных по выигрышам и рискам решений в кооперативных играх при неопределенности // Системы управления и информационные технологии, 1.1(39), 2010. – С. 148-15.
- Кудрявцев К.Н. Побочные платежи в одной кооперативной игре с учетом рисков // Вестник Южно-Уральского государственного университета. Серия: Математика. Механика. Физика. 2011. №10 (227), С. 25 – 28.
- Жуковский В.И., Кудрявцев К.Н. Уравновешивание конфликтов при неопределенности. II. Аналог максимина // Математическая Теория Игр и ее Приложения. 2013. Т. 5, № 2. C. 3-45.
Количество просмотров публикации: Please wait