СРАВНИТЕЛЬНЫЙ АНАЛИЗ БАЗ ДАННЫХ И БАЗ ЗНАНИЙ (ОНТОЛОГИЙ) ПРИМЕНИМО К МОДЕЛИРОВАНИЮ СЛОЖНЫХ ПРОЦЕССОВ

Гончар Алексей Дмитриевич
Сургутский государственный университет
аспирант

Аннотация
В статье нами будут рассмотрены такие понятия информатики и систем управления как базы данных и базы знаний (онтологии).
В ходе рассмотрения данных понятий мы попытаемся дать наиболее точные их определения, а так же выделить основные плюсы и минусы представленных способов хранения информации с точки зрения отрасли применения.

Ключевые слова: базы данных, базы знаний, онтологии


COMPARATIVE ANALYSIS OF DATABASES AND KNOWLEDGE BASES (ONTOLOGIES) APPLICABLE TO MODELING COMPLICATED PROCESS

Gonchar Aleksey Dmitrievich
Surgut State University
postgraduate student

Abstract
The article consider the concepts of computer science and control systems as databases and knowledge bases (ontologies).
During consideration of these concepts, we try to give them the most accurate definition, as well as highlight the main advantages and disadvantages of the present methods of information storage in terms of industry applications.

Keywords: databases, knowledge bases, ontologies


Рубрика: 05.00.00 ТЕХНИЧЕСКИЕ НАУКИ

Библиографическая ссылка на статью:
Гончар А.Д. Сравнительный анализ баз данных и баз знаний (онтологий) применимо к моделированию сложных процессов // Современные научные исследования и инновации. 2014. № 5. Ч. 1 [Электронный ресурс]. URL: https://web.snauka.ru/issues/2014/05/34325 (дата обращения: 18.04.2024).

Базы данных

В первую очередь, при рассмотрении основных особенностей и способов применения баз данных дадим определение понятию.

База данных – представленная в объективной форме совокупность самостоятельных материалов, систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ) [1].

Так же, помимо вышеуказанного определения, существуют еще несколько определений опубликованных различными авторами в своих научных трудах. Ниже перечислим наиболее часто встречаемые определения.

База данных — организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей [2].

База данных — некоторый набор перманентных (постоянно хранимых) данных и процедур, используемых прикладными программными системами какого-либо предприятия [3].

База данных — совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей организации [4].

Несмотря на некоторые различия субъективных мнений экспертов, существуют некоторые стандартизированные определения понятия база данных.

База данных — совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных [5].

База данных — совокупность данных, организованных в соответствии с концептуальной структурой, описывающей характеристики этих данных и взаимоотношения между ними, причём такое собрание данных, которое поддерживает одну или более областей применения [6].

Практическое применение баз данных

Базы данных за время их применения нашли большое распространение в сфере моделирования реальных объектов и систем. В первую очередь базы данных используются в качестве хранилища информации и обеспечения доступа и манипулирования хранимыми данными. Для достижения поставленных задач в современных БД используются системы управления базами данных (СУБД).

В настоящее время наиболее распространенным видом СУБД являются реляционные СУБД (РСУБД) – СУБД, основанные на реляционной модели данных.

В реляционных базах данных вся информация сведена в таблицы, строки и столбцы которые называются кортежами и атрибутами соответственно. Эти таблицы получили название реляций. Записи в таблицах не повторяются. Их уникальность обеспечивается первичным ключом, содержащим набор полей, однозначно определяющих запись.

Наиболее известным продуктом, реализующим РСУБД, является программный комплекс Oracle Data Base компании Oracle.

Основные достоинства и недостатки применения баз данных

К основным достоинствам реляционных баз данных можно отнести следующее:

  • Модель хранимых данных отображает информацию в наиболее простой для пользователя форме;
  • В основе БД лежит развитый математический аппарат, который позволяет достаточно лаконично описать основные операции над данными;
  • При манипулировании и доступе к данным используются языки манипулирования данными не процедурного типа;
  • Манипулирование данными на уровне выходной БД и возможность динамического изменения данных.

Несмотря на перечисленные достоинства, в современном мире, при расширении границ моделирования систем, были обнаружены существенные ограничения при использовании баз данных в качестве основного хранилища информации.

К основным недостаткам применения баз данных относятся:

  • Медленный доступ к данным;
  • Трудоемкость разработки;
  • Результатом запроса к базе данных является информация, хранимая в самой БД. При этом, часто требуется, чтобы в результате запроса был получен логический вывод на основе хранимых данных;
  • При использовании баз данных проблематично моделировать сложные связи, в отличие от онтологического подхода.

Онтологии

Термин «онтология» применяется в двух различных отраслях и имеет два разных определения:

Онтология – философская дисциплина, которая изучает наиболее общие характеристики бытия и сущностей;

Онтология – артефакт, структура, описывающая значения элементов некоторой системы.

Неформально, онтология представляет собой некоторое описание взгляда на мир применительно к конкретной области. Это описание, в свою очередь, состоит из терминов и правил использования этих терминов, ограничивающих их значения в рамках конкретной области.

Формально, онтология – система, состоящая из набора понятий и набора утверждений об этих понятиях, на основе которых можно строить классы, объекты, отношения между ними и теории.

Наиболее известным определением понятия онтология является определение сформулированное Томасом Грубером, согласно которому:

Онтология – это спецификация концептуализации. Под концептуализацией здесь понимается структура реальности, рассматриваемая независимо от словаря предметной области и конкретной ситуации.

В применении онтологий в настоящее время условно можно выделить два направления.

Первое направление связано с представлением онтологии как формальной системы, основанной на математически точных аксиомах. Онтологии, построенные на основе данного подхода, называют формальными.

Второе направление развивается в рамках компьютерной лингвистики и когнитивной науки, где термин онтология понимается как система абстрактных понятий, существующих только в сознании человека, которая может быть выражена только на естественном языке. Данные онтологии часто называют лингвистическими.

До недавнего времени данные направления развивались отдельно. Но сейчас существует много различных проектов, в рамках которых данные направления тесно связаны. При этом обычно не делается предположений о точности или непротиворечивости такой системы.

Поэтому иногда бывает сложно отделить лексические онтологии с элементами формальных аксиоматик от логических систем с включениями лингвистических знаний.

Независимо от различных подходов построения онтологий  можно выделить 3 основных принципа классификации любой онтологии:

  • По степени формальности;
  • По содержимому;
  • По цели создания.

Практическое применение онтологий

В настоящее время в мире существует несколько направлений применения онтологий.

Основными из данных направлений являются:

  • Экспертные («советующие») системы;
  • Хранилища данных;
  • Нейронные сети;
  • Нечеткая логика.

При этом для реализации онтологий в каждом из направлений используются специализированные языки описания онтологий.

Под языком описания онтологий понимается язык, как правило, формальный, применяемый для кодирования онтологий. На данный момент наиболее развиты следующие языки описания:

  • OWL (Web Ontology Language). Применяется в проекте W3C [7];
  • KIF (Knowledge Interchange Format) и его расширение CL (Common Logic). Применяется для описания синтаксиса;
  • CycL. Наиболее известный язык, после OWL. Применяется в проекте Cyc.

Для обеспечения удобства разработки онтологий существует несколько редакторов онтологий, позволяющих одновременно работать с онтологиями, реализованными на основе различных технологий и при помощи различных языков.

Основные достоинства и недостатки применения онтологий

К основным достоинствам применения онтологий при моделировании систем можно отнести следующее:

  • Обеспечение простоты развития системы со временем;
  • Возможность получения в результате запроса не «сырых» данных, а логического вывода на основе хранимых данных;
  • Легкость моделирования сложных связей и отношений, по сравнению с базами данных;
  • Возможность использования согласованной (разделяемой всеми) терминологии с точно определенной семантикой, позволяющего интегрировать и использовать данные (информацию) из разных источников;
  • Возможность динамического изменения данных.

К основным недостаткам применения онтологий относятся:

  • Сложность восприятия хранимых данных;
  • Трудоемкость разработки.

Библиографический список
  1. Гражданский кодекс РФ, ст. 1260.
  2. Когаловский М. Р. Энциклопедия технологий баз данных. — М.: Финансы и статистика, 2002. — 800 с.
  3. Дейт К. Дж. Введение в системы баз данных = Introduction to Database Systems. — 8-е изд. — М.: Вильямс, 2005. — 1328 с.
  4. Коннолли Т., Бегг К. Базы данных. Проектирование, реализация и сопровождение. Теория и практика = Database Systems: A Practical Approach to Design, Implementation, and Management. — 3-е изд. — М.: Вильямс, 2003. — 1436 с.
  5. ГОСТ Р ИСО МЭК ТО 10032-2007: Эталонная модель управления данными.
  6. ISO/IEC 2382-1:1993. Information technology — Vocabulary — Part 1: Fundamental terms.
  7. Web Ontology Language (OWL) [Электронный ресурс] URL: http://www.w3.org/2001/sw/wiki/OWL.


Количество просмотров публикации: Please wait

Все статьи автора «Гончар Алексей Дмитриевич»


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте или через форму обратной связи.

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться:
  • Регистрация