Проект №1 по парсингу данных – торгово-производственная компания
В DIS Group обратилась одна из крупных российских торгово-производственных компаний. Чтобы заказать товары b2b-клиенты этой компании оформляют технические задания (ТЗ). В каждой компании-заказчике принят свой формат формирования ТЗ. Структура технических заданий также у всех разная: по-разному указаны наименование продукта, его характеристики, количество. В одном техническом задании может быть таблица, поля которой будут иметь соответствующее название. В другом – в текстовом документе указано: «ручка, ш., 54» или «ручка должна быть красной», или «ручка, толщина шарика от 0,5 миллиметров».
После получения ТЗ сотрудники торгово-производственной компании вручную ищут каждый товар в каталоге товаров для составления коммерческого предложения. Процесс это трудоёмкий и требует много человеко-часов. Его нужно было автоматизировать – настроить парсинг данных из ТЗ с помощью Informatica Data Transformation. Informatica Data Transformation легко справился с этой задачей, смог эффективно вычленять наименования товаров и их характеристики из технических заданий. Понять, какая именно характеристика указана (зелёный – это цвет или размер?), помогает Informatica Data Quality. На основе полученных данных Data Quality ищет в продуктовом каталоге товары, которые максимально полно соответствуют тому, что указано в ТЗ. Сложные и сомнительные случаи отправляются на проверку и разбор вручную людям. Результаты этой проверки возвращаются в Informatica, на основе этого система продолжает дообучаться. В вопросах оптимизации можно пойти ещё дальше: автоматически формировать коммерческое предложение. Informatica Data Transformation справится и с этим. Он поставит на поток подготовку таких коммерческих предложений, с которыми привыкли работать ваши клиенты, подрядчики и партнёры.