УДК 519.816

ТОПОЛОГИЧЕСКАЯ МОДЕЛЬ ПРОБЛЕМНОЙ ОБЛАСТИ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ

Ревякин Сергей Васильевич
Тюменский государственный нефтегазовый университет
кандидат технических наук доцент кафедры электроэнергетики

Аннотация
Предложена топологическая модель проблемной области на естественном языке. Описание проблемной области замкнуто относительно правил вывода и операций алгебры множеств.
Модель можно использовать при создании эффективных и разрешимых механизмов вывода, при построении формальной семантики естественного языка и во многих других случаях. Рассмотрены возможные пути использования топологической модели в прикладных задачах искусственного интеллекта.

Ключевые слова: естественный язык, проблемная область, топологическая интерпретация, топологическая модель


TOPOLOGICAL MODEL OF PROBLEM AREA IN A NATURAL LANGUAGE

Revyakin Sergey Vasilyevich
Tyumen state oil and gas university
Candidate of Technical Sciences, Associate professor of electrical power engineering

Abstract
The topological model of problem area in a natural language is offered. The description of problem area is closed concerning rules of a conclusion and operations of algebra of sets.
The model can be used at creation of effective and solvable mechanisms of a conclusion, at creation of formal semantics of a natural language and in many other cases. Possible ways of use of topological model in applied problems of artificial intelligence are considered.

Keywords: natural language, problem area, topological interpretation, topological model


Рубрика: 05.00.00 ТЕХНИЧЕСКИЕ НАУКИ

Библиографическая ссылка на статью:
Ревякин С.В. Топологическая модель проблемной области на естественном языке // Современные научные исследования и инновации. 2013. № 4 [Электронный ресурс]. URL: http://web.snauka.ru/issues/2013/04/23407 (дата обращения: 05.06.2017).

Введение

Идея топологической интерпретации логических исчислений была впервые предложена А. Тарским в 1938 г. и с тех пор практически не использовалась в задачах искусственного интеллекта [1, с. 36]. Преимущества предлагаемого подхода с очевидностью вытекают из основных свойств топологических моделей - замкнутости относительно правил вывода и относительно операций алгебры множеств, выводимости в исчислении высказываний всех формул, общезначимых в модели и наоборот, а также возможности представления всех фактов и знаний в виде индексных файлов с записями одинаковой структуры.

Для того чтобы использовать эти свойства, предложен способ представления текста на естественном языке из высказываний (ЕЯ-текста) в виде замкнутой системы множеств, которая удовлетворяет аксиомам определения топологического пространства [2, с. 35, 3, с. 15]. Базы знаний в виде топологического пространства удобны для постановки и решения многих интеллектуальных задач.

1 Топологическое пространство на основе текста из высказываний

В [3, с. 9] предложена схема построения полного множества ALL альтернативных атомарных высказываний, которые описывают отношения между объектами в исходном ЕЯ-тексте TEXT. Для примера будем использовать текст из одного высказывания «Где бы ни был Сэм, Фред всегда рядом».

1 Описание проблемной области TEXT записывается в виде списка LIST формул языка исчисления предикатов.

2 На основе LIST формируется расширенный текст TEXT_ATOM из атомарных высказываний, в котором высказывания, моделируемые замкнутыми формулами, заменены составными, описывающими отношения между конкретными объектами. В TEXT_ATOM в высказываниях явно присутствуют сказуемые и пропозициональные связки, которые в исходном тексте могут быть «по умолчанию». В TEXT_ATOM сказуемые связывают два конкретных объекта. В атомарных высказываниях конкретные объекты не имеют структуры, являются «неделимыми». Ими могут быть предметы, числа, абстрактные объекты, а также в специальных случаях функциональные выражения (термы). Например, в высказывании Фред, Сэм – конкретные объекты, терм x не является конкретным объектом. Полученный на основе примера TEXT_ATOM имеет вид: «Если Сэм в парке, то Фред в парке. Если Сэм в доме, то Фред в доме».

3 На основе расширенного текста TEXT_ATOM формируется множество

ATOM атомарных (без пропозициональных связок) высказываний. В примере ATOM = {Сэм в доме, Сэм в парке, Фред в парке, Фред в доме}.

4 Формирование множества O конкретных объектов, отношения между которыми описывают атомарные высказывания из ATOM.
, где
- набор объектов i-го сорта. В примере O= {Сэм, Фред, парк, дом}.

5 Дополнение множества ATOM атомарных высказываний до полного ALL путем генерации альтернативных атомарных высказываний.

ALL =, где
- полный набор альтернативных атомарных высказываний, описывающих альтернативные отношения между конкретными объектами . Для примера выше получим:

- дополнением высказывания “Фред в парке” будет высказывание “Фред не в парке”;

-
ALL(Фред, парк) = {Фред в парке, Фред не в парке}.

Критерием полноты множества ALL являются следующие два требования:

- при произвольном значении высказываний исходного текста каждый непустой полный набор содержит только одно истинное атомарное высказывание;

- полные наборы при не пересекаются.

В примере ALL = {Сэм в доме, Сэм не в доме, Сэм в парке, Сэм не в парке, Фред в доме, Фред не в доме, Фред в парке, Фред не в парке}.

Множество P(ALL) подмножеств множества ALL удовлетворяет аксиомам определения топологического пространства:

  • ALL Î P(ALL), Æ
    Î P(ALL),
  • объединение всякого множества элементов системы P(ALL) является элементом P(ALL),
  • пересечение любых двух элементов P(ALL) является элементом P(ALL).

    Таким образом, пара <ALL,P(ALL)> – это топологическое пространство, точки которого - атомарные высказывания.

    Элементы P(ALL) можно рассматривать как теоретико-множественную интерпретацию всевозможных атомарных и составных высказываний, которые можно построить из элементов множества ALL. P(ALL) содержит комбинации из атомарных высказываний и их отрицаний, которые рассматриваются как множества, атомарное высказывание является одноэлементным множеством. Элементы P(ALL) можно получить также путем объединения или пересечения других множеств из P(ALL), всякое высказывание в виде множества также можно получить как дополнение другого множества.

    2 Топологическая интерпретация языка классического исчисления предикатов первого порядка

    В моделях логических исчислений в [3, с. 16] для обеспечения очевидности интерпретации операций в качестве носителя топологического пространства T=<E, P(E)> используется множество E всевозможных атомарных отношений, сформированное на основе полного множества атомарных высказываний ALL и их отрицаний, P(E) – множество подмножеств множества E. Каждый элемент E – это атомарное множество отношений M(A), которое описывает атомарное высказывание A. Очевидно, что множества ALL и E, а также множества P(ALL) и P(E) эквивалентны.

    При формировании модели в [1, с. 204] используется вариант классического исчисления предикатов первого порядка Â, в котором нет символов 1, &, Ú, º, Ø и всякая элементарная формула - это либо 0, либо пропозициональная переменная , либо формула вида , где
    - предикатная переменная,
    - термы. Другими словами, формулы языка Â могут содержать как пропозициональные, так и предикатные переменные, например É
    - формула языка Â.

    Рассмотрим топологическую интерпретацию языка классического исчисления предикатов первого порядка Â [1, с. 204], описанную в терминах отношений [3, с. 30].

    Топологической интерпретацией языка Â назовем всякую упорядоченную пару <Т, Ф>, где Т
    - топологическое пространство, Т =<E,P(E)>, Ф - интерпретирующее отображение, которое каждой предикатной переменной ставит в соответствие семейство подмножеств множества E. Например, Ф(Место1)={M(«Сэм в парке»), M(«Сэм в доме»)}, где M(«Сэм в парке»), M(«Сэм в доме») – множества отношений, которые описывают атомарные высказывания «Сэм в парке» и «Сэм в доме».

    При интерпретации формулы A ее значение , ÎP(E), формируется посредством оценки m, которая содержит значения всех пропозициональных и предикатных переменных, входящих в A. Оценкой m назовем последовательность множеств отношений из P(E) вида , где - произвольные множества из P(E) (значения пропозициональных переменных ), - элементы из ,…,, интерпретирующие , …, , m
    - номер предикатной переменной , n - порядковый номер (параметр) множества в Ф(). Например, , , где M(Сэм в доме), M(Фред в доме) – множества отношений, которые описывают атомарные высказывания «Сэм в доме», «Фред в доме» соответственно.

    Индукцией по построению формулы A определим ее значение .

    Определение 1

    1 Если А есть 0, то =Æ
    при любой оценке
    m.

    2 Если A - пропозициональная переменная , то при

    =.Например, если , то по оценке = M(«Саша помогает Петру»), = M(«Саша помогает Петру»).

    3 Если A = , то при

    ,

    4 Интерпретация формулы
    .

    Значение формулы при оценке
    имеет вид:

    =

    =Æ при .

    По смыслу формуле соответствует конъюнкция атомарных высказываний, в каждом из которых предметная переменная заменена ее значением.

    На основе принятых допущений значение формулы примем в виде:


    =Æ

    Аналогично формуле соответствует дизъюнкция.

    5
    A = B É
    C

    Пусть - значение формулы B при оценке
    m. Тогда . Содержательно можно рассматривать как множество отношений из полного набора E, которые «остаются» при отрицании отношений .

    При использовании модели важным является свойство общезначимости формулы [1, с. 204].

    Определение 2

    Формула A топологически общезначима, если в любом топологическом пространстве T при любой топологической интерпретации <T, Ф> и при любой оценке m ее значение .

    В [1, с. 207] доказаны важные для приложений следствия.

    Следствие 1
    Если формула классического исчисления предикатов выводима, то она топологически общезначима.

    Следствие 2
    Если формула не общезначима в модели, то она не выводима в классическом исчислении предикатов.

    В модели [1] нет очевидного соответствия между истинностью высказывания A и пустотой множества отношений M(A), которые описывает данное высказывание A. Например,

    M(“Сэм–хозяин Фреда&”День–суббота”) =

    M(Сэм–хозяин Фреда”)ÇM(“День–суббота”) = Æ, т.к. точки топологического пространства M(Сэм–хозяин Фреда) и M(“День–суббота”) не пересекаются. Однако, это несоответствие никак не влияет на основное свойство модели: из выводимости формулы вытекает ее общезначимость.

    Другое несоответствие в [1] проявляется при интерпретации отрицания.

    Например, пусть

    E = {M(«клерк с опытом»), M(«клерк без опыта»), M(«клерк знает компьютер»), M(«клерк не знает компьютер»)}, m = M(«клерк с опытом»).

    Тогда
    M(«клерк с опытом»),

    {M(«клерк без опыта»), M(«клерк знает компьютер»), M(«клерк не знает компьютер»)}.

    Другими словами, отрицание высказывания «клерк с опытом» означает справедливость высказывания «клерк без опыта»V«клерк знает компьютер»V«клерк не знает компьютер», что соответствует состоянию всей предметной области при отрицании истинного высказывания «клерк с опытом».

    Приведенные выше несоответствия с реальной практикой в модели [1] устранены в топологических моделях с объектно-ориентированным способом интерпретации отрицания [3, с. 19]. В этом случае интерпретация отрицания высказывания «клерк с опытом» имеет вид: M(«клерк без опыта»).

    В [3, с. 16] рассмотрены перспективные точные модели классического исчисления высказываний, в которых всякая топологически общезначимая формула выводима в исчислении и наоборот. Модели проблемной области на основе точных моделей существенно упростят постановку и решение многих прикладных задач, поскольку они наследуют все свойства разрешимого классического исчисления высказываний [3, с. 61].

    3 Топологическая модель в прикладных задачах

    искусственного интеллекта

    Предложенные в [3, с. 19] топологические модели и способ топологической интерпретации текста из высказываний обладают важными для приложений свойствами:

    - замкнутость базы знаний относительно правил вывода и относительно

    произвольных операций в динамически изменяющихся данных,

    - выводимость в исчислении высказываний всех формул, общезначимых

    в точных топологических моделях и наоборот,

    - непротиворечивость модели, что делает ее удобной для пополнения новыми знаниями,

    - стандартное представление данных и знаний на предлагаемом подмножестве ЕЯ, позволяющее избежать нерегулярностей и двусмысленностей.

    В [3, с. 53] выделено два вида стандартного представления правил в расширенном тексте TEXT_ATOM:

    - на логическом уровне стандартной формой является хорновское высказывание º
    ,

    - при машинной реализации, соответственно, высказывание , где – атомарные высказывания или их отрицания из ALL.

    Тождество означает, что при машинной реализации расширенного текста

    TEXT_ATOM дизъюнкты Хорна можно представить в виде набора импликаций
    - записей индексного файла с одинаковой структурой, iÎ{1,2,…,n}. После представления высказываний в виде списка атомарных импликаций TEXT_ATOM будет включать как атомарные высказывания и их отрицания, так и составные высказывания
    из атомарных импликаций .

    Машинное представление всех данных и знаний в виде индексных файлов с записями одинаковой структуры позволит:

    - существенно сократить время поиска за счет индексного доступа к файлам из атомарных импликаций,

    - осуществлять одношаговый поиск по индексу формул Хорна

    с истинными гипотезами (см. рисунок),

    - автоматически решать, какие формулы в модели позволяют вывести истинное высказывание Aj из гипотез , а какие не позволяют,

    - автоматически исключить с помощью индексного доступа формулы , анализ которых считается бесперспективным,

    - эффективно использовать индексный доступ в задачах экспоненциальной сложности,

    - существенно увеличить эффективность дедуктивного вывода за счет сокращения пространства поиска посредством индексного доступа к данным и знаниям.


Библиографический список
  1. Новиков П.С. Конструктивная математическая логика с точки зрения классической. М.: Наука, 1977. 328 с.
  2. Ревякин С. В. Топологическая интерпретация текста на естественном языке из высказываний // НТИ. Сер. 2. 2001. № 6. С. 33–36.
  3. Ревякин С. В. Топологическая модель проблемной области на естественном языке. М/: bookvika, 2012. 97 с. URL: http://shop.bookvika.ru/catalog/product/id/3357728

 



Все статьи автора «Ревякин Сергей Васильевич»


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте или через форму обратной связи.

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться: