Управление данными
Управление данными (data governance) выполняется обычно на трех уровнях:
- составление и ведение концептуальной модели данных для предприятия Заказчика. Концептуальная — значит не зависящая от приложений и реализации. Чаще всего она есть отражение тезаураса или глоссария компании, а точнее — онтологии понятий предметной области Заказчика. Иногда мы поддерживаем и четвертую модель — онтологическую, так как она более подвижна и изменчива, в то время как концептуальная модель — это уже первый шаг формализации, причем не просто шаг в жизненном цикле, а шаг с конкретным прикладным применением: маппинг логических моделей данных друг на друга
- составление и ведение логической модели данных для каждого приложения Заказчика. Маппинг и трассировка логических сущностей на коцептуальные
- составление и поддержание физической модели данных для каждого приложения Заказчика. Трассировка физических сущностей (таблиц) на логические. Этот уровень все чаще уходит в прошлое ввиду снижения роли баз данных в структурировании данных.
Управление данными на концептуальном и онтологическом уровне носит в большей степени семантический характер и направлено на поддержание понятийной целостности, информационной консистентности и прозрачности, в то время как логический и физический уровень моделирования обеспечивают интероперабельность данных/объектов в системах Заказчика. Физические методы обработки и хранения данных (альфа- или каппа-архитектуры, hadoop, data warehouse, data lake) для нас вторичны и не являются фокусом нашей компетенции.
Основые методы управления информацией и данными в ходе оказания наших услуг:
- семантический анализ данных
- каталогизация данных
- моделирование данных
- нормализация даннных относительно SID (Shared Information & Data) model (только для провайдеров цифровых услуг)
- формирование устойчивых агломераций — цифровых двойников
- распределение данных по доменам, выделение ответственных за данные.
Поскольку данные есть предмет обработки и актив компании, то востребованы также следующие услуги:
- группировка поведения (функций) вокруг объектов данных
- распределение данных по шагам процесса их обработки
- разработка канонической (интеграционной) модели данных.
Отдельной областью нашей компетенции является выделение и упорядочивание слоя НСИ в модели/моделях данных заказчика.
Поскольку анализ данных представляет собой работу со структурами сетевого характера, то для систематизации данных, учета (ведения данных), моделирования и трассировки данных используются специализированные инструменты. Один из таких инструментов — программный продукт «СиММА» (в конфигурации "Бизнес-логика") — см. описание в прилагаемом pdf-файле.
Примеры реализованных проектов по теме моделирования данных:
Описание системы, которая может быть использована для моделирования данных и метаданных (10,2 МБ)
Скачать
Список услуг