28 Окт 2022
8 мин
485

Отличия аналитика данных от Data Scientist

Чтобы сделать продукт лучше и отвечать запросам клиентов, компаниям нужно собирать и анализировать большие объемы данных. Здесь не обойтись без аналитиков

Содержание

Отличия аналитика данных от data scientist

Аналитик данных ищет возможность улучшить бизнес-показатели. Специалист по data science ищет закономерности в данных и создает практически полезные модели: например, прогнозы погоды.

Аналитик данных проводит анализ, упаковывает результаты в понятный,  доступный вид и презентует их. Data scientist может увидеть неявные закономерности в базе данных, упаковать их в понятную и эффективную модель, которая будет работать и приносить измеримый результат.

Аналитик данных изучает то, что уже случилось, и на этой основе делает выводы. Data scientist выявляет закономерности в процессах и прогнозирует, что может случиться и почему.

Аналитик данных собирает данные, обрабатывает их и делает выводы. На основе этих результатов в компании принимают решения, как действовать дальше. Например, какой промокод клиенты используют чаще всего, какой вид контента им нравится. На основе этих данных можно понять, какую площадку для продвижения лучше использовать.

Data scientist тоже собирает и обрабатывает данные, но это только часть его работы. Результатом его деятельности будет модель — код, который написан на основе анализа. Эту модель внедряют в бизнес-процесс, и всё начинает крутиться лучше и эффективнее.

Что должен знать и уметь data scientist

Специалист по data science должен знать основы программирования, базовые основы математической статистики, хорошо разбираться в том, что такое регрессионные зависимости, теорема Гаусса — Маркова и так далее. А еще хорошо бы любить программирование, математику и сложные задачи.

То есть data scientist должен знать всё, что знает аналитик данных, и еще — моделирование, анализ, глубокую математику, статистику и машинное обучение.

Вот примерные навыки, которые должны быть у такого специалиста:

  • чистить и обрабатывать данные;
  • развивать модели машинного обучения и новые методы;
  • изучать корреляцию между разными переменными и находить новые точки роста в данных;
  • искать новые решения, которые помогут увеличить прибыль бизнеса;
  • визуализировать данные и превращать их в понятную историю.

Рис.1. Жизненный путь проекта data scientist

Что должен знать и уметь аналитик данных

Аналитику данных тоже нужно знать основы математической статистики, Excel — что такое сводные таблицы и как работают функции. Быть готовым изучить Python, хорошо знать SQL, уметь использовать регулярные выражения и OLAP-кубы. Представлять различные разрезы данных и уметь рассказать историю с помощью данных.

Примерные навыки, которые должны быть у аналитика данных:

  • анализировать уже существующие данные, чтобы выявлять поведенческие шаблоны пользователей;
  • предлагать новые метрики, чтобы улучшать понимание различных частей продукта;
  • коммуницировать с командой data-инженеров, чтобы лучше собирать информацию о поведении пользователей в продукте;
  • применять методы статистического анализа;
  • дизайнить и создавать отчеты, чтобы помогать бизнесу принимать лучшие и обоснованные решения.

Рис.2. Жизненный путь проекта аналитика данных

Что должен знать и уметь аналитик данных и data scientist:

Аналитик данных Data scientist
Математика и статистика Математика и статистика
Языки программирования: Python, SQL Языки программирования: R, Python, SAS, Matlab, SQL, Pig, Hive, Scala
Визуализация данных с помощью Tableau, Power BI Визуализация данных с помощью Tableau, Power BI
Hadoop
Модели машинного обучения
Готов работать с неструктурированными данными и создавать предиктивные модели

Что делает и какие задачи решает аналитик данных

Такой специалист:

  • создает профили клиентов;
  • уменьшает отток клиентов;
  • увеличивает средний чек покупки;
  • анализирует структуры продаж;
  • измеряет эффективность маркетинговых кампаний.

Пример задачи № 1. Нужно понять, что в большей степени оказывает влияние на пользователя, когда он решает, продолжать игру или нет.

Решение. Нужно провести анализ поведения пользователя в первые пять сессий и выявить схожесть в поведении тех, кто решил продолжить играть.

Пример задачи № 2. Нужно понять, поможет ли новый туториал увеличить средний чек на 25%.

Решение. Необходимо провести A/B-тестирование гипотезы. Для этого нужно рассчитать текущие показатели, определить, какое число пользователей необходимо включить в тест, на какой уровень значимости ориентироваться и так далее. По результатам теста принять решение: являются ли изменения значимыми и можно ли их применить для всех пользователей.

Пример задачи № 3. У части товаров есть сезонный спрос. Нужно провести анализ: какие товары следует включить в группу сезонных — и для каждого из подразделов выработать рекомендации о том, когда нужно наращивать запас этих товаров на складах, а когда — прекращать. Провести анализ удовлетворенности спроса на товар по сезонам.

Решение. Сделать выгрузку данных о покупках за последние три года и построить гистограммы спроса по месяцам. А еще проанализировать заполняемость складов этим типом товаров в течение года.

Что делает и какие задачи решает data scientist

Специалист по data science:

  • создает спам-фильтры для почтовых систем;
  • предотвращает мошенничество;
  • создает рекомендации для пользователей онлайн-магазинов;
  • создает чат-боты;
  • занимается алгоритмами распознавания речи;
  • выявляет и распознает объекты на изображениях.

Пример задачи № 1. Нужно привлечь пользователей из разных маркетинговых источников и составить максимально точный прогноз: сколько денег принесут пользователи из каждого канала. Это поможет оптимизировать затраты.

Решение. Составить настолько точную модель машинного обучения, чтобы она максимально приближенно выдавала LTV (пожизненную ценность клиента) у пользователей из определенных источников.

Пример задачи № 2. Пользователи заходят в онлайн-магазин и покупают только один предмет.

Решение. Построить модель машинного обучения: она будет предлагать пользователю такие сопутствующие товары, которые он с высокой долей вероятности купит в дополнение к основному товару.

Пример задачи № 3. Есть данные за последние 10 лет о тяжести прохождения заболевания N в каком-либо регионе. Нужно выработать модель, которая будет максимально точно объяснять: как образ жизни и доход пациента влияют на тяжесть течения болезни и скорость выздоровления. Например, если доход пациента был бы выше на 1000 ₽, то выздоровление наступило бы на два дня раньше.

Решение. Определить тип модели, с которой придется работать, и провести регрессионный анализ для максимально точной оценки коэффициентов.

Чeм пoxoжи пpoфeccии аналитика данных и data scientist

Во многом эти направления похожи, потому что помогают бизнесу принимать важные решения на основе анализа данных.

Вот три ключевые компетенции, которые есть и у аналитика данных, и у специалиста по data science:

  1. Похожие технические навыки: Python, SQL, R и Tableau. Оба специалиста должны быть прокачаны в статистике и визуализации данных.
  2. Оба работают с большими массивами. Должны быть готовы работать с данными низкого качества, уметь разумно чистить данные и приспосабливать их для анализа или прогнозирования.
  3. Оба должны уметь работать и общаться с коллегами без технического бэкграунда и находить с ними общий язык, чтобы не возникало конфликтов. Так будет проще работать и получать классный результат.

Куда пойти учиться, чтобы стать аналитиком данных или специалистом по data science

Как стать аналитиком данных: окончить университет по направлениям «Математика», «Экономика» и прочим специальностям с большим количеством математики.

Как стать data scientist: окончить вуз по специальности «Инженер-программист» или получить любую профессию, где есть бэкграунд программирования.

Но пять-шесть лет в вузе — необязательное условие для вхождения в эти профессии. Если вам близки эти направления — сходите на бесплатные или платные курсы, изучите материалы. Поймите, подходит вам или нет, попробуйте что-то сделать самостоятельно, а потом развивайтесь в этих направлениях дальше.

Например, у Skypro есть профессия «Аналитик данных» и отдельный навык «Основы SQL для анализа данных».

На курсах от Skypro за 10 месяцев вас научат быть аналитиком данных. Дадут весь объем материала и практики для позиции младшего аналитика:

  • работа с данными в Excel;
  • работа с SQL;
  • работа с Python для обработки данных;
  • статистика для анализа данных.

Наставники и кураторы будут отвечать на все вопросы, проверять домашки и подробно их разбирать, указывать на ошибки и на то, что уже классно получается. А еще — устраивать мотивационные мастер-классы, где разберут вообще все вопросы, расскажут, как не выгореть во время учебы, как лучше планировать время и многое другое.

А в конце учебы будет три тестовых собеседования, чтобы вы раскрепостились. Специалисты карьерного центра проконсультируют, как лучше оформить резюме, чтобы точно найти работу.

Сначала может показаться, что курсы слишком дорогие. Но если вспомнить, сколько получают аналитики данных и специалисты по data science уже на старте, — становится понятно, что затраты быстро окупятся. Например, младший аналитик получает от 80 000 ₽, а специалист среднего и старшего уровня — до 230 000 ₽.

Помните: можно стать классным специалистом даже без профильного образования.

Сколько зарабатывают аналитики данных и data scientists

Бизнес хочет зарабатывать — всегда ценятся специалисты, которые знают, как это сделать. Именно поэтому профессии, связанные с анализом данных, так востребованы на рынке труда.

По результатам исследования Хабр Карьеры о зарплатах айтишников в первом полугодии 2022 года, в среднем зарплата аналитика данных составляла 104 000 ₽, а data scientist — 150 000 ₽.

Уровень зарплаты и реальные вакансии аналитиков данных и data scientist на хедхантере можно отслеживать на графиках Tableau. Этот анализ провели специалисты Left Join — блога об аналитике, о визуализации данных, data science и BI. Они регулярно обновляют таблицу, чтобы все были в курсе актуальных зарплат и свежих вакансий.

Как развиваться в профессиях аналитика данных и data scientist

Сообщество Open Data Science в прошлом году опубликовало статью, из которой видно: интерес к аналитикам данных и специалистам по data science растет и не собирается останавливаться.

Практичнее всего проходить курсы по отдельным направлениям, например «Базовые курсы по математике», если вы не математик, «Основы статистики», «Основы SQL». Или курсы по профессиям: «Аналитик данных» и так далее.

Главное — набрать опыт: подписаться на профильные телеграм-каналы, читать специализированные статьи, откликаться на вакансии, даже вы пока новичок в сфере.

Выросло и количество вакансий с удаленкой.

Коротко о главном

Аналитики данных и специалисты по data science анализируют данные — только аналитик на основе анализа объясняет, как улучшить бизнес-модель, а data scientist разрабатывает модель или код, который нужно внедрить, чтобы всё заработало еще эффективнее.


Получите пошаговый план развития в карьере после записи на курс






    Оставляя заявку, вы принимаете условия соглашения

    Учёба ради учёбы — это не прикольно. На наших курсах вы ставите конкретные цели и достигаете
    их
    в заданные сроки. Начинайте карьеру с первых достижений!

    Добавить комментарий

    Вставить формулу как
    Блок
    Строка
    Дополнительные настройки
    Цвет формулы
    Цвет текста
    #333333
    Используйте LaTeX для набора формулы
    Предпросмотр
    \({}\)
    Формула не набрана
    Вставить