Своим опытом в области Data Governance делятся Пол Келлер и Гэри Джорджес из страховой компании L.A. Care Health Plan. Вопросы экспертам задаёт Томас Бренс, директор продуктового маркетинга в области данные как сервис в Informatica.
Как выбрать, с чего начать реализацию программы Data Governance?
Мы начали с того, что провели анализ рисков во всей организации по 72 параметрам. Мы выявилли, что для бизнес-модели L.A. Care Health Plan важнейшую роль играет высокое качество данных о лечебных учреждениях.
Низкое качество этих данных мешает компании оптимально управлять сетью партнёрских медицинских организаций. Эта проблема не уникальна, она распространена по всей стране. Обычно данные о поставщиках услуг (в том числе и медицинских) точны на 30%. Низкое качество данных было для нас самым большим риском, эту проблемы стоило в первую очередь решать с помощью Data Governance.
Как сохранить темп внедрения Data Governance?
Программа по Data Governance и обеспечению качества данных приведёт к значительным изменениям во всей организации. Поэтому очень важно перед началом программы заручиться поддержкой кого-то из топ-менеджмента. Data Governance – это горизонтальная функция, для того, чтобы придать ей значимость в компании жизненно необходима поддержка кого-то из руководства.
Сотрудники в любой организации будут сопротивляться переменам. При этом, чем дольше поддерживался статус кво, тем сильнее будет сопротивление. Поддержка кого-то из руководителей покажет, что организация в любом случае будет стремиться к извлечению пользы из Data Governance, какими бы сложными не были изменения, которые для этого приходится делать. Если у вас будет поддержка руководства, всё остальное приложится.
Как проводить масштабирование программы по Data Governance?
Data Governance оптимально начать внедрять с одного домена данных, только потом масштабировать программу на всю компанию. В L.A.Care Data Governance связана с программой управления мастер-данными, которая выстроена вокруг данных лечебных учреждений. Именно вокруг данных о лечебных учреждениях мы начали внедрять Data Governance.
Идея была в том, чтобы только для этого домена начать выстраивать политики, процессы, процедуры, стандарты, уровни сервисов для Data Governance, а также управленческие структуры в организации (совет по Data Governance, совет по качеству данных, сеть стюардов по данным). Позже полученный опыт можно перенести и на другие домены данных (для L.A. Care таким доменом стали данные о наших клиентах – тех, кто приобрёл страховку). Начинайте с малого: разработали небольшой элемент, протестировали его, извлекли уроки из ошибок. Data Governance для второго домена данных можно уже внедрить быстрее, проще и качественнее. Не пытайтесь объять необъятное.
Как измерить результаты проекта по Data Governance?
Для данных о лечебных учреждениях мы создали 60 эталонных стандартов и 11 этапов валидации источников. Кроме того, мы разработали более двух тысяч правил качества данных, чтобы оценивать это качество по 10 различным критериям.
Данные, которые не удовлетворяют установленным требованиям, отправляются обратно в источник (то есть, в лечебное учреждение) для улучшения. Мы оценили качество данных 44 программ медицинского страхования (82 тысяч записей каждый месяц) по этим стандартам. Результаты оказались неудовлетворительными – оказалось, что данные качественные только на 10-15%. Опираясь на стандарты качества мы очистили и поправили данные и получили очень хорошие результаты. Критерии качества непосредственно самих данных: точность (более 95%), семантика (100%), структура (более 95%), взаимосвязи (уточняется). Критерии контекста, в котором находятся данные: полнота (более 95%), правдоподобность (около 60%), употребительность (85%), актуальность (уточняется), распознаваемость (98%), непротиворечивость (уточняется).
Какое значение имеет конфиденциальность данных?
Вторая инициатива Data Governance в нашей компании связана именно с защитой данных. Эта инициатива нашла широкую поддержку среди руководства компании, возглавил её директор по ИТ. В рамках этой инициативы мы проводим оценку потенциального влияния нарушения конфиденциальности данных, их целостности и доступности. Кроме того, мы определяем, насколько чувствительна та или иная информация.
Результаты этих оценок помогли понять, как нужно работать с данными на электронных и неэлектронных носителях. Кроме того, стало ясно, кто и в каких обстоятельствах может получить к ним доступ. Делается это благодаря контролю доступа к информации каждого отдельного сотрудника или контролю доступа к каждому отдельному атрибуту. Учитывая, что мы работаем в очень зарегулированной области медицинского страхования, риск утечки данных, безусловно, один из самых серьёзных для нас.
Как устроена программа Data Governance у вас?
Мы используем Informatica Enterprise Data Catalog (EDC) и Axon Data Governance для того, чтобы определить технические и бизнес-метаданные и каталогизировать их для домена данных «лечебное учреждение» и для информационной безопасности.
Мы можем публиковать согласованные эталонные стандарты для данных в EDC, который интегрирован с бизнес-контекстом в Axon (определение терминов, линеджи данных, регуляторная НСИ и НСИ по политике L.A. Care, на которые можно ссылаться). Одновременно с этим мы выявляем и пресекаем мошеннические действия с данными и несанкционированное использование данных.
Также читайте об опыте внедрения Data Governance другой страховой компании.