Введение
Идея топологической интерпретации логических исчислений была впервые предложена А. Тарским в 1938 г. и с тех пор практически не использовалась в задачах искусственного интеллекта [1, с. 36]. Преимущества предлагаемого подхода с очевидностью вытекают из основных свойств топологических моделей - замкнутости относительно правил вывода и относительно операций алгебры множеств, выводимости в исчислении высказываний всех формул, общезначимых в модели и наоборот, а также возможности представления всех фактов и знаний в виде индексных файлов с записями одинаковой структуры.
Для того чтобы использовать эти свойства, предложен способ представления текста на естественном языке из высказываний (ЕЯ-текста) в виде замкнутой системы множеств, которая удовлетворяет аксиомам определения топологического пространства [2, с. 35, 3, с. 15]. Базы знаний в виде топологического пространства удобны для постановки и решения многих интеллектуальных задач.
1 Топологическое пространство на основе текста из высказываний
В [3, с. 9] предложена схема построения полного множества ALL альтернативных атомарных высказываний, которые описывают отношения между объектами в исходном ЕЯ-тексте TEXT. Для примера будем использовать текст из одного высказывания «Где бы ни был Сэм, Фред всегда рядом».
1 Описание проблемной области TEXT записывается в виде списка LIST формул языка исчисления предикатов.
2 На основе LIST формируется расширенный текст TEXT_ATOM из атомарных высказываний, в котором высказывания, моделируемые замкнутыми формулами, заменены составными, описывающими отношения между конкретными объектами. В TEXT_ATOM в высказываниях явно присутствуют сказуемые и пропозициональные связки, которые в исходном тексте могут быть «по умолчанию». В TEXT_ATOM сказуемые связывают два конкретных объекта. В атомарных высказываниях конкретные объекты не имеют структуры, являются «неделимыми». Ими могут быть предметы, числа, абстрактные объекты, а также в специальных случаях функциональные выражения (термы). Например, в высказывании Фред, Сэм – конкретные объекты, терм x не является конкретным объектом. Полученный на основе примера TEXT_ATOM имеет вид: «Если Сэм в парке, то Фред в парке. Если Сэм в доме, то Фред в доме».
3 На основе расширенного текста TEXT_ATOM формируется множество
ATOM атомарных (без пропозициональных связок) высказываний. В примере ATOM = {Сэм в доме, Сэм в парке, Фред в парке, Фред в доме}.
4 Формирование множества O конкретных объектов, отношения между которыми описывают атомарные высказывания из ATOM.
, где
- набор объектов i-го сорта. В примере O= {Сэм, Фред, парк, дом}.
5 Дополнение множества ATOM атомарных высказываний до полного ALL путем генерации альтернативных атомарных высказываний.
ALL =, где
- полный набор альтернативных атомарных высказываний, описывающих альтернативные отношения между конкретными объектами . Для примера выше получим:
- дополнением высказывания “Фред в парке” будет высказывание “Фред не в парке”;
-
ALL(Фред, парк) = {Фред в парке, Фред не в парке}.
Критерием полноты множества ALL являются следующие два требования:
- при произвольном значении высказываний исходного текста каждый непустой полный набор содержит только одно истинное атомарное высказывание;
- полные наборы при
не пересекаются.
В примере ALL = {Сэм в доме, Сэм не в доме, Сэм в парке, Сэм не в парке, Фред в доме, Фред не в доме, Фред в парке, Фред не в парке}.
Множество P(ALL) подмножеств множества ALL удовлетворяет аксиомам определения топологического пространства:
-
ALL Î P(ALL), Æ
Î P(ALL),
-
объединение всякого множества элементов системы P(ALL) является элементом P(ALL),
-
пересечение любых двух элементов P(ALL) является элементом P(ALL).
Таким образом, пара <ALL,P(ALL)> – это топологическое пространство, точки которого - атомарные высказывания.
Элементы P(ALL) можно рассматривать как теоретико-множественную интерпретацию всевозможных атомарных и составных высказываний, которые можно построить из элементов множества ALL. P(ALL) содержит комбинации из атомарных высказываний и их отрицаний, которые рассматриваются как множества, атомарное высказывание является одноэлементным множеством. Элементы P(ALL) можно получить также путем объединения или пересечения других множеств из P(ALL), всякое высказывание в виде множества также можно получить как дополнение другого множества.
2 Топологическая интерпретация языка классического исчисления предикатов первого порядка
В моделях логических исчислений в [3, с. 16] для обеспечения очевидности интерпретации операций в качестве носителя топологического пространства T=<E, P(E)> используется множество E всевозможных атомарных отношений, сформированное на основе полного множества атомарных высказываний ALL и их отрицаний, P(E) – множество подмножеств множества E. Каждый элемент E – это атомарное множество отношений M(A), которое описывает атомарное высказывание A. Очевидно, что множества ALL и E, а также множества P(ALL) и P(E) эквивалентны.
При формировании модели в [1, с. 204] используется вариант классического исчисления предикатов первого порядка Â, в котором нет символов 1, &, Ú, º, Ø и всякая элементарная формула - это либо 0, либо пропозициональная переменная
, либо формула вида
, где
- предикатная переменная,
- термы. Другими словами, формулы языка  могут содержать как пропозициональные, так и предикатные переменные, напримерÉ
- формула языка Â.
Рассмотрим топологическую интерпретацию языка классического исчисления предикатов первого порядка Â [1, с. 204], описанную в терминах отношений [3, с. 30].
Топологической интерпретацией языка Â назовем всякую упорядоченную пару <Т, Ф>, где Т
- топологическое пространство, Т =<E,P(E)>, Ф - интерпретирующее отображение, которое каждой предикатной переменнойставит в соответствие семейство
подмножеств множества E. Например, Ф(Место1)={M(«Сэм в парке»), M(«Сэм в доме»)}, где M(«Сэм в парке»), M(«Сэм в доме») – множества отношений, которые описывают атомарные высказывания «Сэм в парке» и «Сэм в доме».
При интерпретации формулы A ее значение
,
ÎP(E), формируется посредством оценки m, которая содержит значения всех пропозициональных и предикатных переменных, входящих в A. Оценкой m назовем последовательность множеств отношений из P(E) вида
, где
- произвольные множества из P(E) (значения пропозициональных переменных
),
- элементы из
,…,
, интерпретирующие
, …,
, m
- номер предикатной переменной, n - порядковый номер (параметр) множества
в Ф(
). Например,
,
, где M(Сэм в доме), M(Фред в доме) – множества отношений, которые описывают атомарные высказывания «Сэм в доме», «Фред в доме» соответственно.
Индукцией по построению формулы A определим ее значение
.
Определение 1
1 Если А есть 0, то
=Æ
при любой оценке
m.
2 Если A - пропозициональная переменная
, то при
=
.Например, если
, то по оценке
= M(«Саша помогает Петру»),
= M(«Саша помогает Петру»).
3 Если A =
, то при
,
4 Интерпретация формулы
.
Значение формулы
при оценке
имеет вид:
=
=Æ при
.
По смыслу формуле
соответствует конъюнкция атомарных высказываний, в каждом из которых предметная переменная
заменена ее значением.
На основе принятых допущений значение формулы
примем в виде:
=Æ
Аналогично формуле
соответствует дизъюнкция.
5
A = B É
C
Пусть
- значение формулы B при оценке
m. Тогда. Содержательно
можно рассматривать как множество отношений из полного набора E, которые «остаются» при отрицании отношений
.
При использовании модели важным является свойство общезначимости формулы [1, с. 204].
Определение 2
Формула A топологически общезначима, если в любом топологическом пространстве T при любой топологической интерпретации <T, Ф> и при любой оценке m ее значение
.
В [1, с. 207] доказаны важные для приложений следствия.
Следствие 1
Если формула классического исчисления предикатов выводима, то она топологически общезначима.
Следствие 2
Если формула не общезначима в модели, то она не выводима в классическом исчислении предикатов.
В модели [1] нет очевидного соответствия между истинностью высказывания A и пустотой множества отношений M(A), которые описывает данное высказывание A. Например,
M(“Сэм–хозяин Фреда“&”День–суббота”) =
M(“Сэм–хозяин Фреда”)ÇM(“День–суббота”) = Æ, т.к. точки топологического пространства M(“Сэм–хозяин Фреда“) и M(“День–суббота”) не пересекаются. Однако, это несоответствие никак не влияет на основное свойство модели: из выводимости формулы вытекает ее общезначимость.
Другое несоответствие в [1] проявляется при интерпретации отрицания.
Например, пусть
E = {M(«клерк с опытом»), M(«клерк без опыта»), M(«клерк знает компьютер»), M(«клерк не знает компьютер»)}, m = M(«клерк с опытом»).
Тогда
M(«клерк с опытом»),
{M(«клерк без опыта»), M(«клерк знает компьютер»), M(«клерк не знает компьютер»)}.
Другими словами, отрицание высказывания «клерк с опытом» означает справедливость высказывания «клерк без опыта»V«клерк знает компьютер»V«клерк не знает компьютер», что соответствует состоянию всей предметной области при отрицании истинного высказывания «клерк с опытом».
Приведенные выше несоответствия с реальной практикой в модели [1] устранены в топологических моделях с объектно-ориентированным способом интерпретации отрицания [3, с. 19]. В этом случае интерпретация отрицания высказывания «клерк с опытом» имеет вид: M(«клерк без опыта»).
В [3, с. 16] рассмотрены перспективные точные модели классического исчисления высказываний, в которых всякая топологически общезначимая формула выводима в исчислении и наоборот. Модели проблемной области на основе точных моделей существенно упростят постановку и решение многих прикладных задач, поскольку они наследуют все свойства разрешимого классического исчисления высказываний [3, с. 61].
3 Топологическая модель в прикладных задачах
искусственного интеллекта
Предложенные в [3, с. 19] топологические модели и способ топологической интерпретации текста из высказываний обладают важными для приложений свойствами:
- замкнутость базы знаний относительно правил вывода и относительно
произвольных операций в динамически изменяющихся данных,
- выводимость в исчислении высказываний всех формул, общезначимых
в точных топологических моделях и наоборот,
- непротиворечивость модели, что делает ее удобной для пополнения новыми знаниями,
- стандартное представление данных и знаний на предлагаемом подмножестве ЕЯ, позволяющее избежать нерегулярностей и двусмысленностей.
В [3, с. 53] выделено два вида стандартного представления правил в расширенном тексте TEXT_ATOM:
- на логическом уровне стандартной формой является хорновское высказывание
º
,
- при машинной реализации, соответственно, высказывание
, где
– атомарные высказывания или их отрицания из ALL.
Тождество означает, что при машинной реализации расширенного текста
TEXT_ATOM дизъюнкты Хорна
можно представить в виде набора импликаций
- записей индексного файла с одинаковой структурой, iÎ{1,2,…,n}. После представления высказыванийв виде списка атомарных импликаций TEXT_ATOM будет включать как атомарные высказывания
и их отрицания, так и составные высказывания
из атомарных импликаций.
Машинное представление всех данных и знаний в виде индексных файлов с записями одинаковой структуры позволит:
- существенно сократить время поиска за счет индексного доступа к файлам из атомарных импликаций,
- осуществлять одношаговый поиск по индексу формул Хорна
с истинными гипотезами
(см. рисунок),
- автоматически решать, какие формулы
в модели позволяют вывести истинное высказывание Aj из гипотез
, а какие не позволяют,
- автоматически исключить с помощью индексного доступа формулы
, анализ которых считается бесперспективным,
- эффективно использовать индексный доступ в задачах экспоненциальной сложности,
- существенно увеличить эффективность дедуктивного вывода за счет сокращения пространства поиска посредством индексного доступа к данным и знаниям.
Библиографический список
- Новиков П.С. Конструктивная математическая логика с точки зрения классической. М.: Наука, 1977. 328 с.
- Ревякин С. В. Топологическая интерпретация текста на естественном языке из высказываний // НТИ. Сер. 2. 2001. № 6. С. 33–36.
- Ревякин С. В. Топологическая модель проблемной области на естественном языке. М/: bookvika, 2012. 97 с. URL: http://shop.bookvika.ru/catalog/product/id/3357728