TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
Data Science Jobs avatar

TGINSIGHT CHAT

Data Science Jobs

@datasciencejobs

Карьера

Лучшие вакансии по темам Data Science, машинного обучения, нейросетей, искусственного интеллекта, компьютерного зрения, сбора, обработки и анализа данных. 🗄Мы в реестре РКН: https://vk.cc/cEZ5Ff По всем вопросам: @musit Чат: @bigdata_ru

Подписчики2.0万Текущее число подписчиков
Постов1,000Проиндексировано постов
Охват51,390Просмотры последних постов
Последние посты

Последние посты

Тег: #dataengineer · 54 постов

当前筛选 #dataengineer清除筛选

Опубликован 4 мая

#вакансия#DE#dataengineer#BI#senior#edtech В быстрорастущий EdTech-продукт ищем Senior Data Engineer, который возьмет ключевую роль в развитии аналитической платформы и BI-направления. Позиция предполагает влияние на весь контур работы с данными: от общения с бизнесом до построения устойчивой инфраструктуры. Команда - 60+ человек, стек: Node.js, PostgreSQL, ClickHouse, Kubernetes. Мы предлагаем: — удаленную работу и гибкий график; — возможность влиять на процессы и предлагать новые подходы; — рост вместе с компанией: команда растет, появляются новые направления и задачи; — вовлеченную команду, которой важны продукт и его польза для пользователей; — работу, где виден результат, продуктом ежедневно пользуются тысячи школьников и их родители; Задачи: — развитие и поддержка data-платформы (DWH + Data Lake); — проектирование и оптимизация ETL/ELT и data pipelines; — перевод бизнес-задач в технические решения; — контроль качества данных и настройка мониторинга; — работа с отчетностью, дашбордами и визуализацией; — взаимодействие со стейкхолдерами; Требования: — опыт работы с данными от 4–6 лет; — уверенный SQL, оптимизация запросов; — опыт с PostgreSQL и ClickHouse; — Python для аналитики и автоматизации; — опыт с Data Lake / Lakehouse или Spark / Hadoop / Databricks; — Airflow, dbt; — понимание архитектуры DWH; — опыт работы с BI-инструментами (Power BI / Tableau / DataLens); — опыт работы с бизнес-заказчиками; — участие в построении аналитических решений. По всем вопросам и с CV пишите:@hello_techrecruiter

2,100 views

Опубликован 18 мар.

#вакансия#vacancy#job#middle#dataengineer Data Engineer в Selectel Санкт-Петербург, Москва (гибкий гибрид) Меня зовут Полина, я рекрутер в Selectel. Мы — продуктовая IT-компания, предоставляем клиентам инфраструктурные решения: свое облако, платформенные сервисы в облаке, а также выделенные серверы — у нас 6 собственных дата-центров. Основные задачи - Взаимодействие с владельцами данных по вопросам сбора и качества данных, проведение системного анализа источников - Разработка и поддержка пайплайнов загрузки данных на Python с использованием DAG’ов Airflow - Разработка dbt-моделей по ключевым бизнес-процессам по схеме «звезда», создание витрин данных - Автоматизация процессов, настройка CI/CD пайплайнов, мониторинга и алёртинга - Участие в развитии процессов Data Quality, Data Catalog и Data Lineage, а также инфраструктуры платформы данных - Взаимодействие с BI разработчиками и аналитиками Мы ожидаем - Опыт работы с реляционными (PostgreSQL) и аналитическими (ClickHouse) базами данных - Опыт разработки на Python, особенно в сфере написания ELT пайплайнов и разработки DAG’ов Airflow - Уверенное знание SQL и опыт оптимизации запросов - Понимание принципов построения DWH - Базовые знания Linux, Docker, Git, CI/CD Если стало интересно, буду рада с вами пообщаться в лс: @apolinque

4,010 views

Опубликован 18 мар.

#вакансия#ГородМосква#удаленнаяработа#DataEngineer 🔆Должность - Data Engineer, Middle и выше 🔶Компания - Арт-Финтех ⌨️Требования к кандидату: - Гражданство и локация РФ - Опыт проектирования потоков загрузки данных в хранилища DWH, опыт работы с промышленными ETL (Informatica PowerCenter как плюс); - Опыт работы с хранилищами данных (Oracle); - Понимание финансовых инструментов и особенности их учета по РСБУ как плюс; - Опыт работы на проектах внедрения/развития хранилищ данных от 3-х лет ✅Чем предстоит заниматься? - Разработка нового и доработка существующего функционала в КХД; - Автоматизация алгоритмов расчета трансфертного результата по операциям на финансовых рынках. - Загрузка и обработка данных для расчета финансового результата по финансовым инструментам. 🔗Условия: Full-time, 5/2. 💵Вилка до 320к рублей на руки. 🪩Немного о нас: Группа компаний «Арт-Финтех» более 20 лет на рынке — международный поставщик инновационных банковских программных решений. Наша компания разрабатывает ПО для финансового сектора 🖋@Oleghols

3,810 views

Опубликован 18 февр.

#вакансия#ГородМосква#удаленнаяработа#DataEngineer 🔆Должность - Data Engineer, Middle и выше 🔶Компания - Арт-Финтех ⌨️Требования к кандидату: - Гражданство и локация РФ - Опыт проектирования потоков загрузки данных в хранилища DWH, опыт работы с промышленными ETL (Informatica PowerCenter как плюс); - Опыт работы с хранилищами данных (Oracle); - Понимание финансовых инструментов и особенности их учета по РСБУ как плюс; - Опыт работы на проектах внедрения/развития хранилищ данных от 3-х лет ✅Чем предстоит заниматься? - Разработка нового и доработка существующего функционала в КХД; - Автоматизация алгоритмов расчета трансфертного результата по операциям на финансовых рынках. - Загрузка и обработка данных для расчета финансового результата по финансовым инструментам. 🔗Условия: Full-time, 5/2. 💵Вилка до 320к рублей на руки. 🪩Немного о нас: Группа компаний «Арт-Финтех» более 20 лет на рынке — международный поставщик инновационных банковских программных решений. Наша компания разрабатывает ПО для финансового сектора 🖋@Oleghols

4,140 views

Опубликован 16 февр.

#Dataengineer#Dataинженер#Dataengineerвакансии Data Engineer 🔥Мы в поиске Дата инженера на проектную занятость Грейд: middle+|Senior Ставка: от 272К до 285К Гражданство/Локация: РФ Загрузка: фуллтайм Срок: долгосрочный Оформление: только ИП 📌 ✅Обязательные требования: - Опыт работы в роли Data Engineer от 4-х лет; - Опыт полного цикла создания данных: от проектирования пайплайнов и моделей до внедрения в production и мониторинга; - Системное мышление, способность проектировать масштабируемые и отказоустойчивые решения, учитывающие объем, скорость и разнообразие данных; - Навыки эффективной коммуникации с командами аналитики, бизнес-аналитиков, DevOps и разработки продуктов; - Опыт проведения нагрузочных тестов DataLake-платформ; - Практический опыт написания эффективных SQL-запросов для анализа и трансформации данных в StarRocks или аналогичных OLAP-системах (ClickHouse, Impala); - Умение создавать и поддерживать таблицы, партиции, представления; - Базовое понимание модели данных StarRocks (дублирующиеся/агрегатные таблицы) для реализации готовых решений; - Опыт загрузки данных (через файлы, INSERT, использование простых коннекторов); - Работа с HMS через Spark или Hive для создания/обновления таблиц, чтения метаданных. Понимание, для чего нужен каталог метаданных; - Уверенная работа с Parquet, Iceberg, JSON, CSV. Понимание преимуществ колоночных форматов; - Опыт написания DAG в Airflow (или аналоги) для планирования регулярных ETL-задач. Понимание принципов идемпотентности и перезапуска задач; - Интеграция Data Ocean Nova с источниками данных (базы данных, BI-инструменты). Понимание архитектуры таких платформ (часто микросервисной на базе K8s); - Понимание, как перечисленные компоненты взаимодействуют друг с другом в единой платформе. Например, как запрос из StarRocks через HMS получает метаданные таблиц, а Ranger проверяет права доступа; - SQL (Продвинутый уровень); - Сложные JOIN, оконные функции (window functions), агрегации; - Умение читать и анализировать план выполнения запроса (EXPLAIN) для базовой оптимизации; - Python (Средний уровень); - Разработка скриптов для ETL, работа с API, Pandas для обработки данных умеренного объема. Знание основ; - PySpark: Умение писать и оптимизировать Spark-приложения (DataFrame API) для пакетной обработки данных. Понимание основ работы трансформаций и действий (transformations/actions), принципов партиционирования данных в Spark; - Kubernetes: Базовое понимание концепций (Pod, Deployment, Service). Опыт запуска и мониторинга своих задач (Spark, контейнеры) в K8s. Умение работать с логами подов. 📆 Задачи: - Самостоятельная разработка, реализация и поддержка интеграционных решений на стеке технологий, принятых в команде (Java, Groovy, Apache Nifi, Airflow); - Определение стека технологий для конкретных проектов и задач; - Решать технически сложные задачи, которые не могут решить другие инженеры в команде; - Оперативно реагировать на информацию о проблемах в зоне ответственности, выполнять задачи в установленные сроки; - Разрабатывать и контролировать актуальность документации по взаимодействию конфигурационных единиц платформы больших данных; - Предоставлять отчеты о своей деятельности начальнику отдела/руководителю в порядке, установленном руководством; - Контроль качества интеграционных решений с последующим созданием задач/дефектов для рефакторинга; - Определять технологическую стратегию развития проекта или продукта, работать на перспективу; - Выстраивать процессы (например, CI/CD, код-ревью), внедрять и развивать инженерные практики. @aliiS_a

4,260 views

Опубликован 4 февр.

#вакансия#vacancy#dataengineer#middle#удаленно 🦋Компания: Twinby ☀️Позиция: Data Engineer (Middle) 💸Вилка: 200к-280к рублей net 📍Формат работы: полная занятость, удаленный формат Всем привет! Меня зовут Полина, Recruitment Lead в Twinby ☀️ 🦋TWINBY — сервис для проверки совместимости и поиска новых знакомств. Наша цель – стать дейтинг-приложением №1 в России, заменив сам-знаешь-что. У нас это отлично получается: сейчас Twinby скачали уже более 14 миллионов пользователей. Мы строим надёжную платформу: ingestion → DWH/витрины → BI/аналитика → продуктовые решения. Сейчас мы в поиске Data Engineer'а, который усилит пайплайны, качество данных и производительность хранилища. Наш стек: Python, ClickHouse, CockroachDB, DataLens, JupyterLab / DataSphere, GitLab, Airflow, AppMetrica / Метрика / GA. Функции в команде: - Разрабатывать и поддерживать ETL/ELT-пайплайны в Airflow; - Проектировать слой данных в ClickHouse: схемы, партиционирование, сортировка, движки (MergeTree-семейство), дедупликация, оптимизация запросов; - Строить витрины/слои для BI (DataLens) и аналитиков; - Обеспечивать качество данных: проверки, алерты, контроль свежести/полноты, разбор инцидентов. Наши ожидания: - Опыт в data engineering от 2–4 лет; - Уверенный Python для ETL: работа с API, обработка данных, аккуратная архитектура кода; - Практический опыт работы с оркестраторами (у нас Airflow): планирование, мониторинг, инциденты, backfill; - Опыт работы с аналитическими хранилищами (у нас ClickHouse) и понимание его особенностей (partitions/order key, merges, TTL, FINAL, dictionaries/матвью); - Опыт построения DWH/мартов и слоёв (stg/core/mart), data catalog/lineage; - Отличный SQL и опыт оптимизации запросов/моделей. Будет плюсом: - Углублённое понимание реляционных СУБД и внутренностей: индексы, планы выполнения, нормализация/денормализация, оптимизация запросов; - Опыт диагностики и решения performance-проблем (у нас есть CockroachDB). Мы предлагаем: - Full-time работа с полностью удаленным форматом; - Официальное оформление по трудовому договору в РФ; - Конкурентную заработную плату; - Корпоративные скидки для сотрудников; - Возможность профессионального развития и карьерного роста. 🦋Контакт для связи:@pppanini (тг)

4,480 views

Опубликован 28 дек.

#вакансия#dataengineer#healthtech#фултайм#москва Вакансия: Data Engineer Компания: AstraTech Формат: гибридный (предпочтительно) / удаленный по РФ Оформление: ГПХ (после ИС возможен переход на ТК) Локация: Москва-Сити Занятость: full-time Вилка: 270 - 320к ₽ гросс AI HealthTech стартап создает продукт, который трансформирует привычные процессы в здравоохранении, делая их эффективнее и меняя мир к лучшему 🕊 Сейчас команда в поиске Data Engineer, который будет заниматься построением и оптимизацией ETL-пайплайнов для обработки миллионов строк медицинских данных. Вам предстоит обеспечивать качество и целостность данных, вы будете работать на стыке клиник, поставщиков данных и ML-команды, обеспечивая стандарты для обучения моделей. Основные задачи: · Анализ, нормализация и очистка крупных медицинских датасетов (EHR, анализы, диагнозы). · Разработка и адаптация ETL-пайплайнов под разные источники данных. · Контроль качества входящих данных, коммуникация с поставщиками и стейкхолдерами. · Тесная работа с ML-инженерами над форматами данных и улучшением пайплайнов. Что ожидаем: · Опыт работы с Python (Pandas, NumPy, PyTorch; PySpark / Dask - плюс). · Практика работы с данными масштаба миллионов записей. · Умение ясно доносить идеи как технической, так и нетехнической аудитории. · Готовность погружаться в медицинскую специфику. Будет плюсом: · Опыт в биоинформатике / медицине / HealthTech. · Понимание конфиденциальности данных (GDPR / HIPAA). · Знание медицинских систем кодирования (ICD-10, LOINC). · Опыт с ETL-оркестрацией (Airflow), FHIR / HL7. Почему стоит откликнуться? · AstraTech - это действительно мощная команда талантливых специалистов, в которой есть несколько PhD, они драйвят процессы и привносят по своему уникальные решения в реализацию продукта. · Возможность применить опыт и развить экспертизу в проекте, который реально помогает людям. · Высокая степень ответственности и влияния на архитектуру данных и конечный продукт. · Работа со сложными задачами и современным стеком технологий. Направляйте ваши отклики с резюме — @Inga_IT📩

5,420 views

Опубликован 23 дек.

#вакансия#fulltime#remote#senior#dataengineer#llm#rag Компания Centicore💙 находится в поисках Senior Data Engineer (LLM / RAG). Мы занимаемся продуктовой и платформенной разработкой под ключ для крупных заказчиков. В рамках проекта команда строит промышленную data-платформу для работы с большими языковыми моделями (LLM) и Retrieval-Augmented Generation (RAG). Формат работы: Удаленка по РФ Вилка: 350–380k на руки (в зависимости от опыта и пожеланий кандидата) Уровень: Senior 🔷 Требования: Отличное знание Python: структуры данных, итераторы, декораторы, асинхронное и параллельное программирование, OOP и FP Уверенное владение SQL: сложные запросы, CTE, оконные функции Опыт работы с vector DB: OpenSearch, Qdrant Опыт построения batch и streaming-сервисов для расчёта embeddings и загрузки их в векторные хранилища Понимание принципов RAG и обогащения LLM контекстными данными Опыт разработки промышленных ETL-сервисов на Python Опыт оркестрации пайплайнов: Apache Airflow, Argo Workflows Хорошее знание Apache Spark / PySpark (производительность, отладка, Spark History Server) Опыт асинхронного взаимодействия с веб-сервисами по REST API (aiohttp, httpx) Опыт работы с PostgreSQL, Oracle Опыт работы с Big Data-хранилищами: Hadoop/HDFS, S3, Hive, Iceberg Опыт работы в JupyterLab / JupyterHub 🔷 Будет плюсом: Опыт потоковой обработки данных Опыт работы в AI / ML / LLM-проектах Понимание требований к данным для обучения и эксплуатации ML-моделей Опыт построения отказоустойчивых data-сервисов в enterprise-среде 🔷 Обязанности: Разработка сервисов пакетной и потоковой обработки данных для вычисления векторных представлений (embeddings) Загрузка и сопровождение данных в векторных хранилищах для использования в RAG-сценариях Разработка и поддержка ETL-пайплайнов под управлением Airflow / Argo Оптимизация SQL-запросов и Spark-приложений Взаимодействие с командами Data Science, ML/LLM и инфраструктуры Участие в развитии data-платформы для LLM-решений 💌 Для откликов и вопросов — писать в лс @ktvsk_d Будем рады знакомству! ❤️

4,290 views

Опубликован 15 дек.

#вакансия#dataengineer#remote#fulltime#senior 💼 Международная технологическая компания с более чем 15-летним опытом работы в области обработки данных и искусственного интеллекта, специализирующаяся на аутстаффинге и техническом консалтинге в поисках Senior Data Engineer на крупный проект для энергетической компании из Германии. 👨‍💻 Какой опыт ожидаем увидеть: * От 5 лет опыта работы * Опыт проектирования хранилищ данных и архитектуры данных * Уверенное владение SQL: написание и оптимизация сложных запросов, работа с большими объёмами данных * Практический опыт применения методологии Data Vault 2.0 * Владение Python для автоматизации ETL/ELT, обработки и анализа данных * Опыт с современным стеком: Snowflake (настройка, безопасность, оптимизация), dbt (Core), Apache Airflow (оркестрация пайплайнов) * Знакомство с Azure DevOps (CI/CD, управление задачами, версионирование) * Английский — не ниже B2 Что предлагает компания? * Формат сотрудничества: B2B-договор. * Полностью удалённая работа из любой точки мира, кроме России, Беларуси и Украины. Доступность в рамках часового пояса CET (до 18:00 CET) * Рaid bench time. * Возможность участвовать во внутренних проектах для поддержания загрузки между клиентскими проектами. * Оплачиваемый больничный. * Компенсация стоимости сертификаций и обучения. * Доступ к передовым проектам в области AI и Data. Вилка: до 5000 usd gross Формат работы: remote Занятость: Full Time 📩 Хотите узнать больше? Напишите мне в тг @veronikavlasovets

5,230 views

Опубликован 9 дек.

#вакансия#dataengineer#remote#fulltime#Python#NoSQL Вакансия: Data Engineer/Backend-разработчик (Middle) Компания: АО «Антиплагиат» Формат работы: удалёнка Занятость: полная занятость Вилка: 255 000 (+/-) gross оклад + годовой бонус Работа в EdTech компании, в команде инженеров данных. Ищем Data Engineer/Python dev (Middle), умеющего организовывать автоматизированный сбор данных из различных источников (интернет, API клиентов), а также контролировать качество получаемых данных. В работе нужно писать краулеры сайтов, разрабатывать службы для получения данных из клиентских API; 80% задач с данными и 20% на разработку. Ожидания от кандидата: 📌2+ года коммерческого опыта работы с Python. 📌Уверенное знание Python 📌Умение обернуть написанный код в Docker-контейнер 📌Опыт работы с SQL/NoSQL БД 📌Опыт использования Linux. Применяем Debian/Ubuntu Что предлагает компания? 🔅Аккредитованная IT- компания и дружный коллектив, объединенный в профессиональный комьюнити 🔅Удаленный формат работы 🔅Конкурентная заработная плата (оклад+ годовой бонус) 🔅Ежегодный Performance Review 🔅Обучение, посещение конференций и курсов 🔅ДМС со стоматологией 🔅Скидки и партнёрские программы Со мной можно связаться: @UmraSvet +7 910 457-77-75

4,800 views

Опубликован 20 окт.

#вакансии#dataengineer#Spark#Scala3#Jenkins#Senior Друзья, всем привет! Ищем Преподавателя для уроков и проверки задач на практический курс по разработке на Spark для действующих Data Engineer. О нас: Standard Data – проектируем и реализуем образовательные решения под заказ крупных компаний в сфере ИИ, дата инжиниринга и веб-разработки. Кого ищем: Преподавателя, которому интересно поучаствовать в качественном образовательном проекте. Что нужно делать: • Проводить занятия, обычно по выбранным (2-4) темам из всего курса. Занятия в формате вебинаров 2 раза в неделю по 2 часа. • Общаться в чате и отвечать на вопросы слушателей курса. • Проверять домашние задания и давать развернутую обратную связь слушателям. Что мы ждем от кандидата: • От 3 - 5 лет в роли DE, опыт оптимизации высоконагруженных приложений/ETL процессов; • Опыт работы со Scala 3; Spark; Kafka + Spark Structured Streaming; Hadoop; Oozie; Yarn. Что мы предлагаем: • Сумма оплаты возможна и больше, всё зависит от опыта, публикаций и результатов собеседования. • За проведение одного двухчасового занятия – 10т.р.-20т.р. в зависимости от вашего опыта. • За проверку ДЗ и итогового проекта – до 60т.р. в зависимости от количества человек в группе. Ждем тебя в нашей команде, пишите в тг, или сразу кидайте резюме: @Kate_HR_IT _____ За успешную рекомендацию по традиции бонус! Суммарно 15т.р.: при прохождении тестового 5 т.р., еще 10 т.р. после 2 месяцев хорошей работы. Если у Вас классный кандидат с большим опытом, то пишите в ЛС, согласуем другой бонус!

4,730 views

Опубликован 11 сент.

#вакансии#senior#ДатаИнженер#DataEngineer#РФ#senioranalyst#удаленка Data Engineer Senior Компания: Luna Capital Локация: РФ; Тип работы: удалёнка; Грейд: Senior Вилка: 200 000 - 240 000 ———————————————— О ПРОЕКТЕ: Приглашаем опытного Data Engineer для развития интеграционных и аналитических решений в ритейле. Проект связан с построением и оптимизацией систем хранения и обработки больших данных (DWH, DataLake), интеграцией различных источников и настройкой конвейеров обработки. Используем современные технологии Big Data и распределённые системы, активно развиваем инфраструктуру. ———————————————— ЧТО НУЖНО ДЕЛАТЬ: Проектировать и развивать интеграционные решения на стеке BigData Настраивать и поддерживать ETL-процессы (Apache Nifi, Airflow или аналоги) Работать с реляционными СУБД (Oracle, Postgres, MySQL, MS SQL и др.), оптимизировать запросы Разрабатывать и сопровождать хранилища на основе Hadoop, Hive и других инструментов экосистемы Настраивать CI/CD, деплой проектов в Rancher/Docker Участвовать в проектировании архитектуры и схем данных (DWH, DataLake) ———————————————— ТРЕБОВАНИЯ: 1. Опыт работы Data Engineer от 4 лет 2. Владение одним из языков программирования (Java, Groovy) 3. Знание принципов ООП, умение читать и разбирать чужой код 4. Опыт работы с системами сборки, деплоем в Rancher, Docker 5. Глубокие знания SQL (индексы, функции, планы запросов, оптимизация) 6. Опыт работы с любой реляционной БД (Oracle, Postgres, MySQL, MS SQL, DB2 и т.п.) 7. Навыки работы с Git в консоли 8. Знание ETL-инструментов (Apache Nifi, Airflow, Talend, Informatica, SAP BW, SAS и т.п.) 9. Опыт работы с Hadoop, понимание устройства HDFS и форматов данных 10. Опыт работы с Hive или другими хранилищами на базе Hadoop 11. Навыки работы с архитектурными схемами, понимание принципов DWH и DataLake Будет плюсом: 12. Опыт администрирования Unix/Linux или Hadoop (HDFS, Yarn, Ranger, Spark, Zookeeper) 13. Опыт работы с системами мониторинга и автоматизации (Zabbix, Ansible) —————————————————- 📩 Отклик в тг: @recruiter_vv К отклику не забудьте указать что вы из канала datasciencejobs, и приложите, пожалуйста: ваше актуальное резюме, а также самостоятельный скрининг по требованиям в формате "+/-", например: 1. Опыт работы Data Engineer от 4 лет +

4,120 views
НазадСтр. 1 из 5Вперёд