Как не превратить озеро данных в болото
Видимость деталей – одна из основных проблем управления данными в озерных хранилищах. Объемы данных и количество их повторяющихся версий затрудняют идентификацию правильных данных по их структурным характеристикам. Терминология, неупорядоченная в целях единообразия описания данных при управлении данными сквозь бизнес-подразделения, ведет к неверному истолкованию добавляемой пользователями информации без общих справочных указателей и семантических согласований.
В этом варианте развития управления данными они могут пригодиться только тем, кто уже знает, что это означает. Следующие потребители, имеющие доступ к тем же данным, сформируют реплику и назовут ее на своих условиях. Озеро данных станет застойной средой, где общность инфраструктуры не способствует обмену знаниями. Озеро превратится в яму грязи, в которой невозможно различить данные, определить, полезны они или нет. Расчистить болото – выявить все особенности того, что в нем имеется. Создание метаданных во время первоначальной регистрации и накопления сведений о данных является лучшим способом обеспечения гибкости и возможности их повторного применения и совместного использования в процессе управления данными.