Data Engineer, Москва

Откликнуться

Команда DWH агрегирует в себе накопленную экспертизу и лучшие практики холдинга в области построения хранилищ данных и аналитических приложений. Мы превращаем информационный хаос в чётко организованную систему, которая позволяет собирать, обрабатывать и анализировать любые объёмы данных. В нашей команде убеждены, что системы хранилищ данных должны максимально помогать людям — автоматизировать рутинные задачи, собирать и анализировать сырые данные, подготавливать почву для удобного и аргументированного принятия решений.

Мы ищем BigData-инженера, готового принять активное участие в разработке одного из крупнейших хранилищ группы компании: десятки петабайт данных, количество узлов кластера более 400, ежедневный прирост информации составляет десятки терабайт. В хранилище собрана информация большинства ключевых бизнес-юнитов компании, которая описывает поведение пользователей рунета: события посещений сайтов, клики (показы) рекламы, использование мобильных приложений, профили соцсетей пользователя, действия пользователей в соцсетях и их публичные сообщения и т. д. Все это позволяет составить достаточно полную картину поведения пользователя во всех сервисах mail.ru и строить на полученных данных сложные математические модели.

Наш стек технологий включает, но не ограничивается:

Database Systems: MySQL, Tarantool, ClickHouse;
Hadoop: Hive, Spark, MapReduce, Kafka;
DataFlow/ETL: Luigi, Airflow;
Business Inteligence: Tableau, Redash, SuperSet;
Continuous Integration: Jenkins, GitLab CI;
IssueTracking / KnwoledgeBase: Jira, Confluence;
Monitoring: Sentry, Graphite, Grafana, Prometheus, Telegraf.

Задачи

Участие в роли BigData Engineer в проекте построения системы обработки и хранения разнородной информации из различных бизнес-юнитов компании на базе Hadoop (BigData DWH);
исследование большого объёма необработанных данных, накопленных в компании;
построение и оптимизация нетривиальных ETL-процессов обработки больших данных, участие в построении процессов потребления данных на всех этапах, их трансформации от появления информации в конкретном бизнес-юните до монетизации полученных знаний;
взаимодействие с командой Data Scientist и совместная реализация стабильного расчёта математических моделей;
поддержка и модификация созданного решения, ответственность за доступность сервиса для внутренних потребителей и корректность предоставляемых для принятия решений данных.

Требования

Не менее года релевантного опыта работы;
опыт работы с большими объёмами данных, понимание стека технологий Hadoop, глубокое знание Spark или Hive (плюсом будет знание Java, Scala в контексте обработки больших данных);
опыт организации ETL-процессов обработки данных (плюсом будет знание code-driven ETL Luigi, Airflow);
знание классических алгоритмов и структур данных (плюсом будет опыт разработки на Python);
знания в области теории обработки и хранения информации;
ссылки на публичные репозитории (статьи с примерами работы приветствуются).

Мы предлагаем

Гибкий график работы

Бонусы и скидки от партнеров

Офис в центре города

ДМС

Профессиональная команда

Интересные задачи

Откликнуться

Формат работы

офисный

комбинированный

дистанционный

Уровень

middle

График работы

полный

VK Реклама

Наша команда развивает платформу VK Реклама, объединяющую все крупнейшие в России и СНГ социальные сети и сервисы с общим охватом более 140 млн человек.

Подробнее о проекте

Мы предлагаем

Гибкий график работы

Бонусы и скидки от партнеров

Офис в центре города

ДМС

Профессиональная команда

Интересные задачи

Data Engineer, Москва

Data Engineer, Москва

Задачи

Требования

Мы предлагаем

Формат работы

Уровень

График работы

VK Реклама

Мы предлагаем

Похожие вакансии

Go/Python разработчик Dbaas

Продуктовый аналитик

Machine Learning Engineer в VK Знакомства

Старший продуктовый аналитик

Продуктовый аналитик

Data Scientist R&D

Продуктовый аналитик

Data Scientist в команду дескриптивной аналитики

Аналитик в команду ленты и рекомендаций

Старший аналитик

Data Engineer

Продуктовый аналитик (Облако B2C)

Специалист по автоматизации тестирования

Аналитик медиаконтента VK Видео

DevOps-инженер на проект DevPlatform

Системный архитектор

Data Scientist (реклама и медиа)

Продуктовый аналитик (новый продукт в VK)

Go/Python инженер-разработчик

Аналитик данных

BI Analyst/Developer по Qlik Sense

Аналитик в направление монетизации

Ведущий Python Developer в команде автоматизации процессов

ML инженер в Почту и продукты Mail.ru

Аналитик данных

Продуктовый аналитик

Python разработчик в команду СМБ

Специалист по автоматизации тестирования

Python Developer

FullStack Developer

DevOps Engineer

Разработчик алгоритмов в команду компьютерного зрения

Аналитик маркетинга и контента

ML Engineer

Продуктовый аналитик форматов

Python developer в команду ML

Технический менеджер VK Cloud

QA Automation

ML - программист

Data Scientist в команду аукциона

Go/Python Developer в команду Runtime

Продуктовый аналитик (VK Знакомства)

ML Engineer (машинный перевод)

Python Developer в команду сервисов данных

Старший Python-разработчик в Группу диалогового движка Маруси

Data Scientist

ML Engineer

C++ Developer в Новости

Руководитель команды

Golang-разработчик в команду Календарь

Data Scientist

Старший аналитик в направление рекламных технологий

Python-разработчик в Команду интерфейсов

Ведущий Python-разработчик

Руководитель команды аналитики форматов и фокусных сценариев

SRE / Системный администратор Linux (One Cloud)

Backend Developer

Python-разработчик

Ведущий Python-разработчик