Что нужно, чтобы стать data scientist?
О том, кто и как может стать data scientist, рассказывает Джо Маккендрик, независимый аналитик и внештатный автор целого ряда зарубежных IT-изданий.
Хочешь быть data scientist? Будь им!
Хотя бы немного соприкасались с анализом данных внутри своей организации? Скорее всего вы уже познакомились с data science. Также, возможно, вы уже знаете и о том, что «наука о данных» помогает эффективнее объяснить значение собранной информации руководству или заказчикам.
Но специалистов в области data science — data scientists – сейчас не хватает. Они пользуются высоким спросом на рынке труда. А, так как искусственный интеллект и машинное обучение постоянно развиваются, становится неясно, профессионалы с какими умениями будут нужны организации через месяц или через год.
Кроме того, data scientists вынуждены прочёсывать всё большие массивы данных, пытаться охватить всё большее количество предметных областей. Для этого существующих специалистов уже недостаточно. Поэтому сейчас кто угодно может развить свои навыки и взять на себя обязанности по data science. Достаточно интереса к аналитике данных.
«Я бы в data scientist пошёл, пусть меня научат»
Что же требуется для того, чтобы стать data scientist или по крайней мере начать исполнять обязанности такого специалиста? Большое значение для этой специальности имеют образование, дипломы и сертификаты. Поэтому новые курсы по data science появляются сейчас очень активно. Ведущие учебные заведения уже предлагают магистерские программы по data science. Такие программы есть в Иллинойском технологическом институте, Северо-западном университете, Стэнфордском университете.
Нет средств или времени на полноценное образование? Существует множество других возможностей обучения. Можно найти качественные бесплатные курсы в Интернете, например, на таких ресурсах, как Coursera, EdX, Udacity, IBM, California Instituter of Technology, Dataquest и KDNuggets.
«Работодатели приходят к осознанию того, что сотрудники, которые умеют использовать данные и аналитику для решения бизнес-задач, имеют большую ценность вне зависимости от их образования и занимаемой должности», – считает Бернард Марр, автор и эксперт в индустрии информационных технологий.
Не боги горшки обжигают
Все двери открыты для тех, кому интересно применять методы data science в своей организации. Майк де Ваал, президент и основатель Global IQX и бывший исполнительный директор Manulife Financia считает, что сам по себе data science можно свести к выполнению нескольких последовательных задач:
- Обозначение проблемы
- Сбор сырых данных
- Обработка данных
- Исследование данных
- Проведение углублённого анализа
- Подведение итогов
Роль data scientist, по мнению Майка де Ваала, – качественно выполнить эти задачи. Дрю Винингс, руководитель развития бизнеса в Diffbot, поставщика API (программные интерфейс приложения) для машинного обучения и компьютерного зрения, считает: «У многих компаний нет ресурсов или возможности нанять опытного data scientist. Они применяют инструменты веб-извлечения данных для того, чтобы сортировать и анализировать собранную информацию самостоятельно. Это значит, что практически любой сотрудник организации может собрать и проанализировать информацию как data scientist. Особенно тот, кто умеет программировать или анализировать данные».
Винингс даёт следующие советы тем сотрудникам компании, кто пока не применяет data science, но хочет этому быстро научиться:
- Научитесь определять, какие данные имеют наибольшее значение. «Важный навык хорошего data scientist – уметь понять, какие данные не иголка, а сено в стоге сена».
- Составьте список целей, которые вы планируете достигнуть. Такой список поможет понять, какие данные можно использовать для реализации этих целей. «Сфокусируйтесь на решении проблем, которые имеют реальную и сиюминутную ценность для бизнеса», – советует Дрю Винингс.
- Проверьте, легко ли собираются данные. «Также необходимо удостовериться, что вы можете собирать данные так часто, как это может понадобиться. Данные могут очень быстро устареть, поэтому веб-извлечение или автоматическое сканирование новых данных будут важной частью рабочего процесса».
- Применяйте внешние данные. «И внутренние, и внешние данные имеют ценность. При этом внешние данные позволят вам шире взглянуть на ситуацию. Они помогут в реальном времени получать инсайты в индустрии, клиентской активности и трендах на рынке, которые можно пропустить, если работать только с внутренними данными».
Источник: блог компании Informatica
Обновлено: 01.07.2018
Опубликовано: 01.07.2018