Каталоги данных существуют уже некоторое время и сегодня стали более стратегическими, поскольку организации масштабируют платформы больших данных, работают в гибридных облаках, инвестируют в программы обработки данных и машинного обучения, а также поддерживают организационное поведение, основанное на данных. Первое, что нужно понять о каталогах данных, заключается в том, что они представляют собой инструменты для всей организации, которые могут изучать источники данных и сотрудничать с ними. Они важны для организаций, которые стараются больше ориентироваться на данные, тех, в которых специалисты по обработке данных экспериментируют с машинным обучением, а также для других, внедряющих аналитику в приложения, ориентированные на клиентов.
Инженеры баз данных, разработчики программного обеспечения и другие технологи берут на себя обязанности по интеграции каталогов данных с основными источниками данных предприятия. Они также используют каталог данных и вносят в него свой вклад, особенно при создании или обновлении баз данных. В этом отношении каталоги данных, которые взаимодействуют с большинством активов данных предприятия, являются единственным источником истины. Они помогают ответить, какие данные существуют, как найти лучшие источники данных, как защитить данные и у кого есть опыт. Каталог данных включает инструменты для обнаружения источников данных, сбора метаданных об этих источниках, поиска в них и предоставления некоторых возможностей управления метаданными.