Кто нужен вашей компании: инженер данных или data scientist?
О том, кто такой инженер данных, чем он отличается от data scientist, рассказывает Адам Мюррей, менеджер по контентному маркетингу компании Sisense. Также Адам объясняет, кто из этих специалистов нужен вашей компании. Также читайте статью Что нужно, чтобы стать data scientist?
Кто заставит данные приносить пользу: инженер данных или data scientist
Рассмотрим такую ситуацию. В вашей компании всё идёт отлично. У вас большая база клиентов. У вас много посетителей на сайте, большинство из них сами запрашивают у вас коммерческое предложение, сами хотят протестировать ваш продукт или услугу. Вы постоянно находите перспективные лиды и хорошие идеи для лидогенерации. Вы постоянно развиваете отношения с партнёрами, потенциальными партнёрами, поставщиками, развиваете различные каналы сбыта.
К чему приводит такая активная работа? К тому, что в вашей организации возникает большой поток данных. Важно эти данные собрать, аккуратно проанализировать, правильно интерпретировать, тогда развивать бизнес можно будет на их основе. Но, чтобы это всё осуществить, нужен квалифицированный специалист. Какой именно? Инженер по данным или data scientist? Может быть непросто сделать этот выбор, потому что между обязанностями этих двух специалистов – очень тонкая грань. Ниже вы найдёте рекомендации, которые помогут вам определиться.
Инженер данных будет искать бриллианты в ваших данных
Данные – это бриллианты. Однако для того, чтобы бриллиант получить, нужно найти алмаз, его извлечь из земли, очистить, обработать. Только тогда ценность бриллианта будет максимальной. Извлечением данных занимается инженер данных. Он одновременно и геолог, и горняк-добытчик. Он ищет, где могли бы быть полезные данные, потом разрабатывает, создаёт, тестирует и поддерживает инструменты для их извлечения, создания их моделей и генерации сырых данных. Другими словами, инженер данных работает с ИТ-архитектурой, базами данных, системами по масштабной обработке данных.
Инженеры данных пытаются выкопать информацию из всех источников, которые доступны в организации, интегрировать данные, управлять ими и оптимизировать их. Зачастую данные оказываются неотформатированными, неподтверждёнными и могут содержать ошибки и специфичные детали. Решить эти проблемы также придётся инженеру по данным. Иногда инженеры могут рекомендовать и внедрять различные способы обработки и улучшения надёжности данных, их качества и прочее.
Инженеру данных нужно стремиться создавать конвейеры данных. Необходимо выстраивать такие конвейеры и обеспечивать их эффективность, создавать постоянный свободный поток данных для data scientist и бизнес-пользователей. Когда данные выкопаны и проведена их первичная обработка, в игру входит data scientist. Благодаря работе инженера данных data scientist получает большие объёмы сырых данных из широчайшего набора источников. С помощью этих данных data scientist старается удовлетворить потребности бизнеса.
Data scientist занимается переработкой сырья в ценные инсайты
Если инженер данных занимается добычей алмазов, то data scientist – их огранкой, созданием бриллиантов. Data scientist шлифует данные для получения ценных инсайтов, которые будут соответствовать задачам бизнеса. Такие специалисты в основном сфокусированы на выявлении отношений между данными внутри организации. Они сравнивают данные, ищут в них закономерности и проводят их статистический анализ. Чаще всего у data scientist хорошие знания высшей математики и/или статистики. Благодаря этому они могут эффективно исследовать рынок и бизнес, чтобы находить в данных тренды и возможности.
Эти драгоценные камни – инсайты – помогут лучше понять компании свой бизнес и клиентов, а значит повысить свою эффективность.
Data scientist VS бизнес-аналитик
Обычно data scientist передаёт результаты своей работы бизнес-аналитику. Тут может возникнуть путаница с обязанностями data scientist и бизнес-аналитика. Важно понимать, что первый анализирует данные, ищет полезные для бизнеса закономерности в них. Второй – отвечает за то, чтобы эти тренды подтвердить с точки зрения бизнеса и представить их представителям бизнеса в правильном бизнес-контексте. Если продолжить нашу метафору с алмазами и бриллиантами, то бизнес-аналитик будет ювелиром. Именно ювелир создаёт что-то ценное для широкой аудитории.
Бизнес-аналитики помогают представителям бизнеса понять закономерности, тренды и инсайты, найденные в данных. В этой цепочке data scientist находится между инженером данных и бизнес-аналитиком, поэтому он должен сочетать в себе техническую экспертизу и понимание бизнеса.
Подробнее о том, какие навыки инструменты нужны data scientist и инженеру по данным, читайте во второй части статьи.
Обновлено: 21.03.2023
Опубликовано: 09.01.2020