В настоящее время предприятия чрезвычайно актуальной является хранения большого количества информации, которая непременно должна находиться на предприятии. По мере своего развития и накопления информации, организация внедряет технологии хранилищ данных.
В данной статье мы рассмотрим построение многомерной модели данных для киоска предприятия «Винтики и Болтики».
Для начала определимся, что же такое хранилище данных. “Data Warehouse” (DW) – хранилище данных – это база, в которой собираются “данные” для последующего их анализа под конкретную решаемую задачу. Хранилище данных, по сути, представляет собой центр, в который собирается вся необходимая информация из различных подразделений предприятия.
Перед построением многомерной модель киоска данных, нужно провести анализ предметной области, выявить типовые запросы, на которые должна будет отвечать система, а так же выявить таблицу фактов, метрики, которые будет рассчитывать система, таблицы измерений.
Данный анализ представлен в постановке задачи.
1. Постановка задачи.
Оплата по договорам за продукцию.
Основная деятельность предприятия «Винтики и Болтики» заключается в производстве изделий: проволоки, шурупов, гвоздей, дюбелей и других изделий различного типа и профилеразмеров из проволоки различного диаметра и сортамента. Производство проволоки и крепежных изделий производится как по заказу покупателя, так и для свободной продажи по рекомендациям маркетингового отдела. Предприятие имеет склады сырья, готовой продукции. На предприятии имеется производственные цеха по изготовлению проволоки и участок упаковки готовых изделий. Готовая продукция отгружается покупателю со склада (если данный товар имеется в наличие склада), либо с завода после изготовления.
Предприятие имеет три основные точки по России, а так же филиалы в других городах.
Оплата сырья производимого предприятием производится двумя способами:
- Оплата наличными средствами в кассе предприятия (либо в филиале предприятия);
- Оплата безналичными средствами через банк.
Киоск данных нашей компании предназначен для анализа продаж и формирование отчетности о доходах от продаж и количестве продаваемой продукции за конкретный период. Типовые запросы, на которые система должна давать ответы, следующие:
- Какова величина общей прибыли за определенный период времени по трем основным точкам предприятия.
- Какова величина общей прибыли за определенный период времени по всем филиалам предприятия.
- Отчет о количестве продаж по каждой производимой продукции предприятия.
- Выявление самой продаваемой продукции за определенный период.
- Выявление менее продаваемой продукции за определенный период.
- Выявление остатков продукции на всех складах предприятия за определенный период.
После анализа предметной области и выявления типовых запросов, на которые должна отвечать система были выявлены следующие факты, метрики, измерения и консольные таблицы.
Факт: продажи.
Метрики: объем продаж, доходы, процент наличной оплаты ко всей.
Измерения: клиент, продукция, время, оплата, основная точка.
Консольные таблицы: предприятие, покупатель.
2. Построение многомерной модели киоска данных для анализа продаж по договорам за продукцию
После анализа предметной области строится многомерная модель киоска данных «Продажи». Тип многомерной модели в данном случае – это снежинка, так как помимо таблиц измерений у нас есть консольные таблицы. Источником данных для киоска данных является фрагмент БД системы.
3. Метаданные уровня модели
Важным моментом в построении является описания репозитория, где описываются все необходимые метаданные. Рассмотрим метаданные трех уровней:
- метаданные уровня модели;
- метаданные уровня таблицы фактов;
- метаданные уровня таблиц измерений
Метаданные – информация, необходимая для управления хранилищем данных. Это «данные о данных», они содержат полное описание логической и физической структуры данных, информацию обо всех элементах Хранилища, способы извлечения информации из различных источников, методы их преобразования из различных структур и форматов и доставки в хранилище.
Рассмотрим метаданные уровня модели, где описываются назначение модели, ее автор, а так же свойства, определенные пользователем.
При описании метаданных уровня таблицы фактов мы прописываем свойства, определенные пользователем, правила манипулирования данными. Источниками для таблицы фактов являются измерения, с помощью которых могут быть рассчитаны метрики (см. рис. 3).
При описании репозитория таблиц измерений описываются свойства, определенные пользователем, правила манипулирования данными, а так же прописываются источники для характеристик.
Источниками данных для характеристик таблиц измерений являются фрагменты реляционных баз данных (см. рис 4).
Рассматривая и анализируя предметную область, была построена многомерная модель киоска данных типа «снежинка» для предприятия «Винтики и Болтики», а так же описан весь репозиторий модели.
Библиографический список
- Махмутова М.В., Махмутов Г.Р. Создание схемы данных для сервера Oracle с помощью Allfusion Erwin Data Modeler / Научныетруды SWorld. 2010. Т. 3. № 2. С. 58a-61.
- Назарова, О.Б., Масленникова, О.Е. Разработка реляционных баз данных с использованием CASE-средства ALL FusionDataModeler: учеб.пособие/О.Б. Назарова, О.Е. Масленникова. -Москва: Изд-во «ФЛИНТА», 2013. -74 с.. -Библиогр.: с. 52. -500 экз.. -ISBN 978-5-9765-1601-4