Базы данных
В первую очередь, при рассмотрении основных особенностей и способов применения баз данных дадим определение понятию.
База данных – представленная в объективной форме совокупность самостоятельных материалов, систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ) [1].
Так же, помимо вышеуказанного определения, существуют еще несколько определений опубликованных различными авторами в своих научных трудах. Ниже перечислим наиболее часто встречаемые определения.
База данных — организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей [2].
База данных — некоторый набор перманентных (постоянно хранимых) данных и процедур, используемых прикладными программными системами какого-либо предприятия [3].
База данных — совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей организации [4].
Несмотря на некоторые различия субъективных мнений экспертов, существуют некоторые стандартизированные определения понятия база данных.
База данных — совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных [5].
База данных — совокупность данных, организованных в соответствии с концептуальной структурой, описывающей характеристики этих данных и взаимоотношения между ними, причём такое собрание данных, которое поддерживает одну или более областей применения [6].
Практическое применение баз данных
Базы данных за время их применения нашли большое распространение в сфере моделирования реальных объектов и систем. В первую очередь базы данных используются в качестве хранилища информации и обеспечения доступа и манипулирования хранимыми данными. Для достижения поставленных задач в современных БД используются системы управления базами данных (СУБД).
В настоящее время наиболее распространенным видом СУБД являются реляционные СУБД (РСУБД) – СУБД, основанные на реляционной модели данных.
В реляционных базах данных вся информация сведена в таблицы, строки и столбцы которые называются кортежами и атрибутами соответственно. Эти таблицы получили название реляций. Записи в таблицах не повторяются. Их уникальность обеспечивается первичным ключом, содержащим набор полей, однозначно определяющих запись.
Наиболее известным продуктом, реализующим РСУБД, является программный комплекс Oracle Data Base компании Oracle.
Основные достоинства и недостатки применения баз данных
К основным достоинствам реляционных баз данных можно отнести следующее:
- Модель хранимых данных отображает информацию в наиболее простой для пользователя форме;
- В основе БД лежит развитый математический аппарат, который позволяет достаточно лаконично описать основные операции над данными;
- При манипулировании и доступе к данным используются языки манипулирования данными не процедурного типа;
- Манипулирование данными на уровне выходной БД и возможность динамического изменения данных.
Несмотря на перечисленные достоинства, в современном мире, при расширении границ моделирования систем, были обнаружены существенные ограничения при использовании баз данных в качестве основного хранилища информации.
К основным недостаткам применения баз данных относятся:
- Медленный доступ к данным;
- Трудоемкость разработки;
- Результатом запроса к базе данных является информация, хранимая в самой БД. При этом, часто требуется, чтобы в результате запроса был получен логический вывод на основе хранимых данных;
- При использовании баз данных проблематично моделировать сложные связи, в отличие от онтологического подхода.
Онтологии
Термин «онтология» применяется в двух различных отраслях и имеет два разных определения:
Онтология – философская дисциплина, которая изучает наиболее общие характеристики бытия и сущностей;
Онтология – артефакт, структура, описывающая значения элементов некоторой системы.
Неформально, онтология представляет собой некоторое описание взгляда на мир применительно к конкретной области. Это описание, в свою очередь, состоит из терминов и правил использования этих терминов, ограничивающих их значения в рамках конкретной области.
Формально, онтология – система, состоящая из набора понятий и набора утверждений об этих понятиях, на основе которых можно строить классы, объекты, отношения между ними и теории.
Наиболее известным определением понятия онтология является определение сформулированное Томасом Грубером, согласно которому:
Онтология – это спецификация концептуализации. Под концептуализацией здесь понимается структура реальности, рассматриваемая независимо от словаря предметной области и конкретной ситуации.
В применении онтологий в настоящее время условно можно выделить два направления.
Первое направление связано с представлением онтологии как формальной системы, основанной на математически точных аксиомах. Онтологии, построенные на основе данного подхода, называют формальными.
Второе направление развивается в рамках компьютерной лингвистики и когнитивной науки, где термин онтология понимается как система абстрактных понятий, существующих только в сознании человека, которая может быть выражена только на естественном языке. Данные онтологии часто называют лингвистическими.
До недавнего времени данные направления развивались отдельно. Но сейчас существует много различных проектов, в рамках которых данные направления тесно связаны. При этом обычно не делается предположений о точности или непротиворечивости такой системы.
Поэтому иногда бывает сложно отделить лексические онтологии с элементами формальных аксиоматик от логических систем с включениями лингвистических знаний.
Независимо от различных подходов построения онтологий можно выделить 3 основных принципа классификации любой онтологии:
- По степени формальности;
- По содержимому;
- По цели создания.
Практическое применение онтологий
В настоящее время в мире существует несколько направлений применения онтологий.
Основными из данных направлений являются:
- Экспертные («советующие») системы;
- Хранилища данных;
- Нейронные сети;
- Нечеткая логика.
При этом для реализации онтологий в каждом из направлений используются специализированные языки описания онтологий.
Под языком описания онтологий понимается язык, как правило, формальный, применяемый для кодирования онтологий. На данный момент наиболее развиты следующие языки описания:
- OWL (Web Ontology Language). Применяется в проекте W3C [7];
- KIF (Knowledge Interchange Format) и его расширение CL (Common Logic). Применяется для описания синтаксиса;
- CycL. Наиболее известный язык, после OWL. Применяется в проекте Cyc.
Для обеспечения удобства разработки онтологий существует несколько редакторов онтологий, позволяющих одновременно работать с онтологиями, реализованными на основе различных технологий и при помощи различных языков.
Основные достоинства и недостатки применения онтологий
К основным достоинствам применения онтологий при моделировании систем можно отнести следующее:
- Обеспечение простоты развития системы со временем;
- Возможность получения в результате запроса не «сырых» данных, а логического вывода на основе хранимых данных;
- Легкость моделирования сложных связей и отношений, по сравнению с базами данных;
- Возможность использования согласованной (разделяемой всеми) терминологии с точно определенной семантикой, позволяющего интегрировать и использовать данные (информацию) из разных источников;
- Возможность динамического изменения данных.
К основным недостаткам применения онтологий относятся:
- Сложность восприятия хранимых данных;
- Трудоемкость разработки.
Библиографический список
- Гражданский кодекс РФ, ст. 1260.
- Когаловский М. Р. Энциклопедия технологий баз данных. — М.: Финансы и статистика, 2002. — 800 с.
- Дейт К. Дж. Введение в системы баз данных = Introduction to Database Systems. — 8-е изд. — М.: Вильямс, 2005. — 1328 с.
- Коннолли Т., Бегг К. Базы данных. Проектирование, реализация и сопровождение. Теория и практика = Database Systems: A Practical Approach to Design, Implementation, and Management. — 3-е изд. — М.: Вильямс, 2003. — 1436 с.
- ГОСТ Р ИСО МЭК ТО 10032-2007: Эталонная модель управления данными.
- ISO/IEC 2382-1:1993. Information technology — Vocabulary — Part 1: Fundamental terms.
- Web Ontology Language (OWL) [Электронный ресурс] URL: http://www.w3.org/2001/sw/wiki/OWL.