Управление данными: что почитать

Актуальность темы управления данными (Data Governance) растет из года в год. Необходимость управления процессами, направленными на сбор, обработку, хранение и использование данными, понимает любая организация. И госсструктура, и коммерческий сектор осознают, что. на основе больших данных производятся расчеты, прогнозы и построение стратегий дальнейшего развития экономики на ближайшие годы. Организации начинают выстраивать бизнес-процессы уже на основании управления данными. Именно поэтому для людей, желающих развиваться в области цифровой трансформации, развитие компетенции «управление данными» очень важна.

Предлагаем краткие обзоры интересных и полезных книг по управлению данными, которые мы рекомендуем для погружения в эту непростую тему.

Книга DAMA-DMBOK. Свод знаний по управлению данными. Второе издание

DAMA-DMBOK2 – настоящий must-have для любого специалиста в области управления данными: от начинающего аналитика до CDO. Книга раскрывает тему настолько подробно, что специалист любого уровня сможет найти в ней для себя что-то новое. Главная задача книги – определить набор руководящих принципов и описать их применение в функциональных областях управления данными. Издание всесторонне описывает проблемы, возникающие в процессе управления данными, и предлагает способы их решения. В руководстве DAMA DMBOK2 подробно описаны широко принятые практики, методы и приемы, функции, роли, результаты и метрики в работе с Big Data.

Задачи «DAMA-DMBOK2»:

  • Выработка общепринятого согласованного представления об областях знаний по управлению данными (выделено 11 таких областей).
  • Определение руководящих принципов управления данными.
  • Предоставление стандартных определений для наиболее часто используемых понятий (общих и по областям знаний).
  • Обзор общепринятых лучших практик, широко распространенных методов и методик, а также наиболее известных альтернативных подходов.
  • Краткий обзор общих организационных и культурных вопросов.
  • Уточнение границ сферы управления данными.

Мастерство визуализации данных

Автор: О.И.Базалева

Часто специалисты по работе с данными разговаривают на сложном, понятном только им языке. Однако информация несет ценность только при ее грамотном встраивании в системы менеджмента всей организации, а для этого важно уметь делать сложную информацию доступной, интерпретировать данные так, чтобы с их помощью принимались эффективные управленческие решения.

Эта книга – отличное руководство по принципам и методам визуализации любых данных с яркими примерами из бизнеса и сугубо практическим подходом к решению задач.
Автор рассказывает читателям, как сложное сделать простым, а громоздкое – легким и прозрачным.

В книге также рассматриваются процессы работы с визуализацией диаграммам и таблиц: основные ошибки и ключевые правила построения диаграмм, таблиц, алгоритмы выбора простых диаграмм, примеры готовых решений для различных бизнес-данных, приемы использования цвета. В труде приводятся многочисленные примеры неудачной визуализации и варианты альтернативных графических решений.

Управление данными. Учебник

Авторы: Ю.Ю.Громов, О.Г. Иванова, А.В Яковлев, В.Г. Однолько

Авторы учебника ставят перед собой цель систематически изложить теоретические основы построения баз данных. В труде рассматриваются основные понятия баз данных, дается характеристика ключевых моделей, излагаются современные подходы к концептуальному проектированию баз данных и раскрываются принципы организации работы с Big Data в сетях. Отдельно рассматриваются современные тренды развития этой сферы знаний. В конце каждой главы читателю предлагается ответить на контрольные вопросы и выполнить задания для освоения материала.

Технологии проектирования баз данных

Автор: Д.Л.Осипов

В книге раскрываются роль и место баз данных в современных информационных системах, рассматриваются основные функции и архитектура СУБД, организация многопользовательского доступа к данным, обеспечение целостности данных, управление транзакциями, физическое хранение отношений, особенности построения индексов, также обсуждаются основные черты коммерчески успешных моделей данных. Автор уделяет особое внимание жизненному циклу баз данных, технологиям проектирования на концептуальном, логическом и физическом этапах и базовым конструкциям, используемым в SQL-ориентированных СУБД.

Помимо прочего в труде раскрывают обязанности персонала, проектирующего и сопровождающего работу с данными, а также требования пользователей. Автор приводит особенности проектирования пользовательского интерфейса клиентских приложений и многое другое.

Базы данных. Инжиниринг надежности

Автор: Кэмпбелл Лейн, Мейджорс Черити

В сфере IT произошла настоящая революция – с инфраструктурой стали работать как с кодом. Этот процесс создает не только новые проблемы, но и возможности для обеспечения безотказной работы баз данных. Авторы подготовили практическое руководство для всех, кто желает влиться в сообщество современных инженеров по обеспечению надежности баз данных (database reliability engineers, DBRE).

В этой книге рассматриваются:

  • Требования к сервисам хранения данных и управление рисками.
  • Создание и развитие архитектуры, обеспечивающей прозрачную поддержку базы данных.
  • Оптимизация процесса управления релизами.
  • Хранение, индексирование и репликация данных.
  • Определение характеристик хранилища данных и подбор оптимальных вариантов его использования.
  • Исследование компонентов архитектуры и создание архитектур, ориентированных на обработку больших данных.

Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим

Автор: Майер-Шенбергер Виктор, Кукьер Кеннет

Это первая большая книга о грядущем революционном явлении, равнозначном интернету или, может, даже печатному станку. Эта книга о новой науке, способной предсказывать будущее на основе быстрой обработки огромных массивов информации и их мгновенного анализа. Она может преобразовывать множество явлений – от стоимости авиабилетов до текста миллионов книг – в форму, доступную для поиска, и с помощью растущей вычислительной мощности совершать невиданные прежде открытия и прогнозы.

Два ведущих специалиста в этой области в доступной форме объясняют, что такое большие данные, как они изменят нашу жизнь и что мы можем сделать, чтобы защитить себя от возникающих опасностей с их стороны, начиная от неизбежной утери конфиденциальности и заканчивая перспективой наказания за проступки, которые еще не совершены.

Распределенные данные. Алгоритмы работы современных систем хранения информации

Автор: А.Петров

Книга является попыткой автора обобщить и систематизировать разрозненную информацию из многочисленных книг, статей, постов и даже из нескольких баз данных с открытым исходным кодом.

Вы узнаете о принципах и концепциях, используемых во всех типах СУБД, с акцентом на подсистеме хранения данных и компонентах, отвечающих за распределение. Эти алгоритмы используются в базах данных, очередях сообщений, планировщиках и в другом важном инфраструктурном программном обеспечении. Вы разберетесь, как работают современные системы хранения информации, и это поможет взвешенно выбирать необходимое программное обеспечение и выявлять потенциальные проблемы.

В книге детально рассматриваются:

  • Механизмы хранения: классификация и таксономия хранилищ, механизмы хранения на основе B-дерева и неизменяемые лог-структуры.
  • Строительные блоки хранилища: организация файлов баз данных, позволяющая создавать эффективные хранилища с использованием вспомогательных структур (кэш страниц и пулы буферов).
  • Распределенные системы: пошаговое руководство по подключению узлов и процессов и построение сложных схем взаимодействия.
  • Кластеры баз данных: модели согласованности в современных базах данных и согласованность распределенных систем хранения.