Управление данными

Управление данными (data governance) выполняется обычно на трех уровнях:

  • составление и ведение концептуальной модели данных для предприятия Заказчика. Концептуальная — значит не зависящая от приложений и реализации. Чаще всего она есть отражение тезаураса или глоссария компании, а точнее — онтологии понятий предметной области Заказчика. Иногда мы поддерживаем и четвертую модель — онтологическую, так как она более подвижна и изменчива, в то время как концептуальная модель — это уже первый шаг формализации, причем не просто шаг в жизненном цикле, а шаг с конкретным прикладным применением: маппинг логических моделей данных друг на друга
  • составление и ведение логической модели данных для каждого приложения Заказчика. Маппинг и трассировка логических сущностей на коцептуальные
  • составление и поддержание физической модели данных для каждого приложения Заказчика. Трассировка физических сущностей (таблиц) на логические. Этот уровень все чаще уходит в прошлое ввиду снижения роли баз данных в структурировании данных.

Управление данными на концептуальном и онтологическом уровне носит в большей степени семантический характер и направлено на поддержание понятийной целостности, информационной консистентности и прозрачности, в то время как логический и физический уровень моделирования обеспечивают интероперабельность данных/объектов в системах Заказчика. Физические методы обработки и хранения данных (альфа- или каппа-архитектуры, hadoop, data warehouse, data lake) для нас вторичны и не являются фокусом нашей компетенции.


Основые методы управления информацией и данными в ходе оказания наших услуг:

  • семантический анализ данных
  • каталогизация данных
  • моделирование данных
  • нормализация даннных относительно SID (Shared Information & Data) model (только для провайдеров цифровых услуг)
  • формирование устойчивых агломераций — цифровых двойников
  • распределение данных по доменам, выделение ответственных за данные.

Поскольку данные есть предмет обработки и актив компании, то востребованы также следующие услуги:

  • группировка поведения (функций) вокруг объектов данных
  • распределение данных по шагам процесса их обработки
  • разработка канонической (интеграционной) модели данных.

Отдельной областью нашей компетенции является выделение и упорядочивание слоя НСИ в модели/моделях данных заказчика.

Поскольку анализ данных представляет собой работу со структурами сетевого характера, то для систематизации данных, учета (ведения данных), моделирования и трассировки данных используются специализированные инструменты. Один из таких инструментов — программный продукт «СиММА» (в конфигурации "Бизнес-логика") — см. описание в прилагаемом pdf-файле.

Примеры реализованных проектов по теме моделирования данных:


Описание системы, которая может быть использована для моделирования данных и метаданных (10,2 МБ) Скачать


Список услуг