Первый в России полностью онлайн-банк зарабатывает на огромных объёмах данных
Бизнес-задача
Интеграция данных должна повысить прибыль за счёт сбора больших данных и более глубокого анализа клиентов
Тинькофф Банк – первый онлайн-банк в России. Эффективное использование больших данных – один из приоритетов компании. Банк активно применяет данные для управленческой отчётности и для предиктивного анализа.
Но данные классического хранилища и хранилища больших данных были разобщены, не были интегрированы. Поэтому ИТ-специалистам приходилось тратить человеко-недели и человеко-часы на подготовку даже предварительных данных при запросе от аналитиков.
«Нам приходилось вручную вести обработку этих неструктурированных и полуструктурированных данных, что требовало много времени, отвлекало разработчиков от основных задач и резко увеличивало время реакции на появление изменений», – говорит Сергей Сотниченко, руководитель направления управления хранилища данных (DWH) банка Тинькофф.
Интеграция данных должна была повысить прибыль за счёт сбора больших данных и более глубокого анализа клиентов. Также должны были снизиться бизнес-риски предложения услуг потенциальному клиенту. При этом эффективность операционной деятельности должна была вырасти за счёт предоставления бизнес-пользователям доступа к данным.
Решение
Руководитель направления управления хранилища данных понимал, что Informatica – один из ведущих вендоров в области ETL-решений
Руководитель направления управления хранилища данных понимал, что Informatica – один из ведущих вендоров в области ETL-решений. Важным фактором при выборе решения стал и тот факт, что у Informatica есть чёткий маршрут развития и развёртывания продукта.
Окончательное решение было принято после того, как DIS Group внедрил успешный пилотный проект за несколько недель.
На базе продукта Informatica Big Data Management была реализована универсальная модель для интеграции любого типа данных в платформу Hadoop. Визуальная среда разработки, возможность повторного использования бизнес-правил и инструменты для командной разработки, входящие в состав платформы Informatica, дают возможность интеграции огромных объемов (сейчас это около 150 ТБ) полуструктурированных и неструктурированных данных в режиме реального времени из биллинговых систем, мобильных приложений, внутреннего сайта и других источников. С помощью этого решения возможно интегрировать и обычные структурированные данные из баз данных Greenplum и Oracle (это около 30 ТБ).
Решение легко может быть масштабировано на уровне корпорации. Аналитические процессы сейчас могут быстро и легко доставлять данные из различных приложений (мобильные, веб- и другие) благодаря высокой скорости доставки данных и встроенных трансформациях, обеспечиваемых платформой Informatica.
В результате внедрения решения расширилось взаимодействие между ИТ и бизнесом. Теперь бизнес-подразделениям, например, рискам и маркетингу, больше не нужно обращаться за помощью к ИТ, чтобы извлечь данные из хранилища в Hadoop. Бизнес-пользователи самостоятельно могут получить данные через BI-решение.
Благодаря Informatica Big Data Management в пять раз сократилось время получения результатов при запросе данных. Раньше банку требовалось около месяца на передачу готовых данных аналитикам. Сейчас же графические средства разработки Informatica дают возможность самодокументирования и командной разработки.
Результат
Решения в банке стали приниматься быстрее и более обоснованно
Решения в банке стали приниматься быстрее и более обоснованно. Уровень конверсии для маркетинговых upsell-кампаний благодаря глубокому исследованию целевой аудитории увеличился в 10 раз.
Бизнес-риски снизились. Команда менеджеров по рискам начала опираться на данные профиля потенциального заемщика, построенные в режиме близком к реальному времени. Это позволяет оценить риски сотрудничества с потенциальным заемщиком до выдачи ему кредита, займа или предложения любого другого финансового продукта.
Снизились и технические риски. Informatica Big Data Management имеет механизмы управления метаданными и графическое представление зависимостей между метаданными. Они позволяют банку превентивно понимать результаты предполагаемых изменений на уровне всего хранилища.