Дистрибуция и внедрение инновационных продуктов и решений для корпоративного сектора от лидеров мирового ИТ-рынка

Data Quality

Informatica Data Quality – это полнофункциональная платформа для оценки, контроля и управления качеством данных в масштабах предприятия. Полномасштабное решение Data Quality позволяет на уровне настраиваемых бизнес-правил производить первичный анализ качества данных, распознавать, проверять, стандартизировать и совершать очистку любых данных; выявлять дубликаты и взаимосвязи между такими данными, как, например, имена (ФИО), адреса, названия, номенклатуры, реквизиты и др., существующими в различных системах предприятия.

Функционал решения включает в себя возможности исправлять написание отдельных строк, устанавливать пороговые значения на число ошибок в написании и другие возможности. Данный функционал платформы по праву считается одним из лучших на рынке.

Informatica Data Quality включает в себя следующие модули:

  • сервер обработки Data Quality, позволяющий выполнять анализ качества данных: очистку, проверку, стандартизациу и дедупликациу данных;
  • клиентское приложение Informatica Data Quality Workbench для разработки и тестирования процессов обеспечения качества данных;
  • клиентское приложение Informatica Data Quality Assistant для ручной обработки данных, не прошедших автоматическую обработку или являющихся кандидатами на дубликаты.

Типы проектов, в которых необходимо качество данных:

  • Построение хранилищ данных,
  • Миграция и консолидация данных,
  • Синхронизация данных,
  • Управление нормативно-справочной информацией,
  • Одноразовая очистка данных,
  • Очистка базы данных он-лайн.

Ключевые возможности

Очистка данных

Informatica Data Quality включает в себя мощные возможности анализа, профилирования, разбора и очистки данных, позволяющие архитекторам и аналитикам осуществлять проверку и стандартизацию данных, улучшать и корректировать любые типы данных, включая информацию о заказчиках, продуктах, финансовых и других данных.

Решение позволяет идентифицировать, сравнивать, анализировать и стандартизировать текстовые и числовые данные произвольной формы с помощью легко настраиваемых бизнес-правил, что в значительной степени помогает автоматизировать процессы очистки и трансформации данных.

Informatica Data Quality позволяет бизнес-специалистам управлять решениями по проверке и обеспечивать качество данных для снижения операционных рисков.

Очистка базы данных может осуществляться по запросу, по расписанию или в режиме реального времени.

Сопоставление данных (Data Matching)

Informatica Data Quality содержит в себе множество мощных и гибких инструментов для сравнения данных, которые позволяют аналитикам и архитекторам определять связи между записями и наличие дубликатов для проведения последующей унификации данных.

Informatica Data Quality представляет собой набор вероятностных методов для проведения сравнения данных, опирающийся на фонетические и синтаксические особенности написания.

Благодаря опции Identity Match Option существует возможность поиска, сравнения и идентификации путем использования «нечеткой» логики. Эта опция позволяет распознавать информацию на 60 языках мира.

Informatica Data Quality предоставляет максимальную прозрачность функций стандартизации и сравнения данных, что позволяет конечным пользователям получить целостный взгляд и контроль за процессами обеспечения качества данных.

Отчетность, мониторинг и оценка качества данных

Informatica Data Quality включает в себя функции мониторинга и динамического формирования отчетности о качестве данных. Это позволяет организациям обеспечивать управление качеством поступающих данных с помощью единого, простого в использовании решения.

Data Quality предоставляет специальные графические средства, которые отражают ключевые характеристики качества данных, такие как полнота, согласованность, связность, точность, целостность и отсутствие дубликатов.

Подробные отчеты позволяют бизнес-аналитикам самостоятельно проверять данные с низким качеством из любого корпоративного приложения. Аналитики могут создавать графические панели (dashboards), которые затем можно экспортировать в BI-системы или размещать на Intranet-сайтах компании, что позволит аналитикам постоянно отслеживать качество данных систем предприятия.

Открытые словари

В решениях, обеспечивающих качество данных, Informatica Data Quality использует открытые текстовые словари, которые могут быть созданы или адаптированы в любом текстовом приложении.

Словари, созданные компанией Informatica, специалистами заказчиков или других компаний, можно использовать одновременно для анализа и стандартизации данных, а также для построения правил проверки качества данных.

Подобные словари обладают всеми возможностями чтения/записи и по своей функциональности сходны с Microsoft Excel. Они предоставляют гибкое и легкое в использовании решение, основанное на внутренних и внешних справочных данных.

Поставка содержит следующие наборы словарей, приведенных к работе с российскими данными:

  • Фамилии, Имена, Отчества;
  • Адреса согласно КЛАДР;
  • Наборы префиксов (к адресам, к именам и т.д.);
  • Телефонные коды городов;
  • Индексы населенных пунктов;
  • Правовые формы организаций;
  • Проверка ИНН и др.

Подробный список предоставляемых словарей

Поддержка всех типов данных

Ни одно другое решение не предоставляет такую широкую поддержку различных типов источников и приемников данных, как Informatica Data Quality.

Informatica Data Quality используется коммерческими и государственными компаниями любых сфер деятельности для управления качеством таких данных, как:
- финансовые данные,
- клиентские данные,
- информация о продуктах, ценах, компаниях,
- данные об именах, адресах, телефонах, электронных адресах,
- промышленные классификаторы,
- любые другие виды данных.

Глобальная языковая поддержка

Informatica Data Quality обеспечивает глобальную мультиязыковую поддержку. Решение поддерживает Unicode, что позволяет использовать не только латинские, но и другие наборы символов. За счет подобной совместимости Informatica Data Quality поддерживает такие языки, как, русский, украинский, казахский и др. Например, представительством Informatica в России уже разработаны конкретные процедуры по автоматической обработке данных русских ФИО и адресов.

Высокий уровень масштабируемости

Решение Data Quality совместимо с различными операционными системами, включая Windows, Linux и Unix.

Существует несколько режимов работы данного программного обеспечения:

  • интерактивный – запуск процессов для проверки и обеспечении качества данных по запросу или по расписанию
  • выполнение процессов в режиме реального времени (например, как часть процессов другого приложения типа CRM, call-center).

Решение поддерживает работу многочисленных пользователей в единой среде. Оно также позволяет создавать механизмы для очистки данных в системах-источниках с возможностью возвращать неочищенные данные для их повторной очистки.

Помимо этого, решение Informatica Data Quality способно выполнять комплексные процессы профилирования и обеспечения качества данных.

Интеграция с SAP и Oracle

Informatica Data Quality поддерживает следующие решения Oracle и SAP:

  • продукт сертифицирован для работы с Oracle Universal Customer Master (UCM) и Oracle CRM, поддерживает очистку, а также нечеткое соответствие данных в указанных продуктах, при этом возможна обработка всех типов данных;
  • продукт полностью поддерживает процессы, обеспечивающие качество данных нормативно-справочной информации в SAP, возможно использование процессов очистки и стандартизации для других видов данных в приложениях SAP.

Полная интеграция с Informatica PowerCenter

Informatica Data Quality тесно связана с платформой интеграции данных Informatica PowerCenter. Используя PowerCenter Designer, можно создать проверку качества данных непосредственно внутри интеграционного процесса. Существует набор трансформаций, встроенных в PowerCenter, позволяющих вызывать и использовать процессы обеспечения качества данных Informatica Data Quality.

Интеграция с PowerCenter существенно повышает скорость разработки, что позволяет упростить выполнение сложных и объемных вычислительных операций и ускорить адаптацию разработчиков к изменяющимся требованиям бизнеса.

Взаимодействие Informatica Data Quality c PowerCenter предоставляет возможность использовать и передавать данные во все типы приложений и баз данных, которые поддерживаются платформой PowerCenter.

Полная интеграция с Metadata Manager

Data Quality обеспечивает полную интеграцию с Metadata Manager в целях отслеживания зависимостей метаданных от источников данных до полей отчётов.

очистка базы данных