Содержимое
#vacancy#Fulltime#remote#DataScientist#SQL#ITВакансии#УдалённаяРабота#python#ML#Вакансия 🔎 Data Scientist Middle+ 💰 Зарплата: 270-300К руб/мес.Гросс 🎯 Локация/гр.: Россия 🕰 Срок проекта: 3 месяца + 📄Оформление: только ИП 🏛Проект: Крупная ритейл компания. Обязательные требования: - Опыт работы от 4-х лет в аналогичной роли; Алгоритмы и структуры данных: - Умение оценивать сложность алгоритмов; - Знание алгоритмов и структур данных из стандартного курса; - Знаком с оценкой производительности стандартных библиотечных структур данных; - Знакомство с алгоритмами из расширенного набора: вероятностные, алгоритмы во внешней памяти, алгоритмы на графах. Теория вероятности и математической статистики: - Предельные теоремы и умение их применять; - Опыт проверки гипотез, знание бутстреп и A/B-тестов, а так же снижение дисперсии и выявление причинно-следственных связей. Машинное обучение (ML): - Понимание ML-алгоритмов и подходов; - Умение эффективно адаптировать их для решения задач при необходимости; - Умение строить модели из стандартных компонентов; - Понимание последовательности этапов разработки ML-решений и готовность вносить изменения в проектную архитектуру; - Понимание какие бизнес-метрики для модели нужно мониторить; - Умение предложить прокси-метрики и функцию потерь, связанные с бизнес-метриками; - Умение докатить простую модель в пилот, имплементировать метод по статье, встроить компонент в существующий пайплайн. - Знаком с менее распространенными методами МО (например: байесовские модели/PGM/VBI, RL и прочее). Операции с моделями (MLOps): - Умение разово зафиттить модель, по запросу проверить, жива ли она, обновить и развернуть какое-либо необходимое ПО в кластере; - Умение версионирования моделей, данных и мониторинг работы моделей, качества данных. SQL: - Простые запросы (выборки, группировки, оконные функции); - Опыт оптимизации запросов. Программирование и инженерия: - Умение перевести идеи в чистый код, который будут и исполнять, и читать; - Умение пользоваться git'ом; - Умение писать тесты; - Способность разбираться в чужом коде и эффективно его дебажить; - Базовое понимание всех компонентов архитектуры. Работа с БД и большими данными (DB & BD): - Промышленный опыт работы с несколькими системами; - Знание внутреннего устройства систем, используемых в работе; - Опыт оптимизации вычислений/запросов транзакции/ACID/Индексов. -Умение декомпозировать понятные задачи; - Самостоятельно находить решение или использовать существующие подходы для понятных задач. Дополнительные стек и требования Задачи: - Разработка кода и тестов на python, участие в командной разработке, участие в код-ревью; - Проработка и изменение дизайна существующих компонентов при необходимости; - Подготовка и валидация обучающих выборок данных для внедрения и сопровождения математических моделей продуктов больших данных; - Расчет результатов АБ-тестов, дизайн АБ-тестов; - Внедрение современных методов машинного обучения и анализа данных в продуктах больших данных; - Разворачивание моделей и сервисов в контуре компании (hadoop/k8s/airflow); - Написание запросов на SQL, оптимизация запросов (spark, в частности); - Предлагать идеи для улучшения модели/подхода; - Предлагать прокси-метрики и функции потерь, связанные с бизнес-метриками; - Контроль соответствия результатов работы менеджеров по работе с большими данными в релизах продуктов больших данных; - Техническая реализация data-science решений на продуктах департамента; - Формирование требований к данным для разработки математических моделей в рамках релизов продуктов больших данных; - Анализ предметной области с целью повышения качества моделей и формирования предложений по достижению целей проектов и продуктов больших данных. 📲 Как откликнуться: Отправляйте своё резюме @AllaDemHR