Один из самых удобных способов записать данные это использование готовых форматов, такие как JSON или YAML.
Из плюсов такого подхода стоит отметить вот что:
🔸 готовый, повсеместно используемый и поддерживаемый формат
🔸 простой и понятный файл, удобочитаемый для человека
🔸 можно легко редактировать в любом текстовом редакторе без специальных программ и библиотек
Но есть и минусы
🔹 затраты времени при записи файла (кодирование данных в нужный формат строки)
🔹 затраты времени при чтении файла (декодирование данных в Python объекты)
🔹 размер файла увеличивается из-за разметки данных (скобки, запятые, переносы, отступы...)
🔹 перед записью все данные должны быть помещены в память в полном объёме (не всегда)
🔹 при чтении необходимо считать весь файл в память и только потом декодировать данные
Если нужно писать немного данных в несколько файлов, то затраты по времени не ощутимы. Обычно это файлы конфига или какие-либо метаданные. Это отличный вариант под такие задачи.
Есть и другой поход к записи файлов - это бинарные файлы. Используется, когда данных достаточно много и никто их не собирается читать глазками😳.
🔸 очень быстрая запись
🔸 чтение значительно быстрей чем JSON, YAML итд
🔸 размер файла значительно меньше, так как нет разметки
🔸 можно записывать данные по мере поступления не загружая всё в память
🔸 можно извлечь любую часть данных независимо
Из минусов
🔹 нужно определить свой формат записи данных (если не используете готовую спецификацию определённого формата)
🔹 не получится открыть файл и визуально понять что там записано, а для чтения файла потребуется знать его спецификацию.
🔹 не так-то просто создать такой файл без специальной библиотеки
В таком виде удобно записывать большой массив любых однородных данных. Например, мониторинг валютной биржи или кэшированная анимация 3D геометрии.
(Это не означает что нельзя записать данные разного типа, просто это будет не так удобно)
Представьте себе JPG-картинку. По сути это немного мета-информации и большой массив пикселей. Тоже самое со звуком или видео файлом. Поэтому, если вы попробуете открыть картинку в текстовом редакторе вы увидите что-то вроде такого
f15d cd29 a564 4578 ...
09e2 9bc4 a696 1253 ...
84e9 4de1 3b23 c24a ...
2534 5161 28e0 709d ...
...
Это и есть записанные байтики. И для их чтения требуется определённый софт который знает что с ними делать. Под каждый тип файла.
К чему это я? Читайте в следующем посте...
#tricks#basic
Рекомендательные системы — один из ключевых механизмов, на которых держатся современные продукты. Они помогают пользователям находить контент, товары и сервисы, а бизнесу — повышать вовлеченность и качество пользовательского опыта. Вместе с Владимиром Байкаловым, ведущим исследователем AI VK, разбираем главные тренды в рекомендациях и последние значимые работы.
🔗Список статей
Масштабирование
🟣Действия говорят громче слов: последовательные преобразователи с триллионом параметров для генеративных рекомендаций
🟣Масштабирование трансформеров для рекомендательных систем до одного миллиарда параметров
🟣LLaTTE: законы масштабирования для многоэтапного моделирования последовательностей в крупномасштабных рекламных рекомендательных системах
Lifelong Recommendations
🟣TransAct V2: моделирование последовательностей действий пользователя на протяжении всей жизни в рекомендациях Pinterest
🟣TWIN V2: расширение моделирования ультра‑длинных последовательностей поведения пользователя для улучшения CTR‑предсказания в Kuaishou
🟣LONGER: повышение эффективности моделирования длинных последовательностей в промышленных рекомендательных системах
🟣Укрощение ультра-длинных последовательностей пользовательского поведения в генеративных рекомендациях на уровне сессий
Generative Retrieval
🟣Память трансформера как дифференцируемый поисковый индекс
🟣Рекомендательные системы с генеративным поиском
🟣Sparse Meets Dense: унифицированные генеративные рекомендации с каскадными разреженно-плотными представлениями
Semantic IDs
🟣Повышение стабильности эмбеддингов в рекомендательных системах с помощью Semantic ID
🟣ActionPiece: контекстная токенизация последовательностей действий для генеративных рекомендаций
🟣Обучаемая токенизация объектов для генеративных рекомендаций
🟣Semantic ID переменной длины для рекомендательных систем
End to End Рекомендации
🟣OneRec: объединение retrieval и ranking в генеративной рекомендательной модели с итеративным выравниванием предпочтений
🟣OxygenREC: генеративный фреймворк, следующий инструкциям, для рекомендаций в электронной коммерции
🟣EGA: унифицированный end-to-end генеративный фреймворк для промышленных рекламных систем
LLMxRecSys
🟣PLUM: адаптация предварительно обученных языковых моделей для генеративных рекомендаций промышленного масштаба
🟣OneRec‑Think: рассуждение в тексте для генеративной рекомендации
🟣ReaSeq: использование мировых знаний через рассуждение для последовательного моделирования
#aivk#recsys
✔️ VK запускает RecSys Challenge — соревнование по рекомендательным системам
Команда AI VK открыла регистрацию на VK RecSys Challenge — масштабное соревнование по созданию алгоритмов рекомендаций. В этом году командам и участникам предстоит решить одну из самых сложных задач индустрии — cold start. 🧠
В прошлом году более 1000+ участников решали задачу по предсказанию явного фидбэка (лайков/дизлайков) клипов, а в этом челендж посложнее. Обычно рекомендательные системы анализируют поведение пользователя и предлагают контент на основе прошлых взаимодействий. Здесь задача зеркальна: нужно предсказать, кому понравится новый клип, которого еще никто не видел. Участникам предстоит работать с реальными данными свежего датасета VK-LSVD, включающего 40 млрд обезличенных взаимодействий с 20 млн коротких видео.
Принять участие могут команды до 4 человек или индивидуально, а призовой фонд составит 2,5 млн рублей.
@ai_machinelearning_big_data
#news#ml#recsys#vkdataset#coldstart#machinelearning
ML engineer Team Lead
#vacancy#вакансия#remote#удаленно#MLTeam Lead #NLP#RecSys#fulltime
Role: ML Team Lead
Company: http://Whisk.com
Location: Remote
Compensation: from 8k usd monthly
About us:
Whisk is the thriving cooking community available on iOS/Android, Web and Samsung hardware (Whisk was acquired by Samsung in 2019). Today we reach millions of users across many markets and languages.
Our stack:
Python, PyTorch, CatBoost, Pytorch Lightning, Transformers, Nvidia Triton, ClickHouse, Mongo, MySQL, Elasticsearch, MLFlow, DVC, KubeFlow, Kubernetes, GCP
Required Qualifications:
• 6+ years working in a software/machine learning engineering role with NLP and/or RecSys technologies.
• Strong machine learning background, and experience in building and productionizing machine learning models.
• Experience leading a team of machine learning engineers and managing project roadmap with data, product, and other engineering teams.
• A history of mentoring other machine learning engineers, if not being a direct manager and scaling a team successfully.
• Strong communication skills and the ability to lead and work with others in a closely collaborative team environment.
• Strong leadership, problem-solving, and relationship-building skills.
• Working proficiency in English.
Type of Work:
Contract-based (Long-term project), full-time (40 hours per week), 100% remotely.
If you interested in this opportunity you can text me in telegram @polina_whisk.
❗️Please note that currently we only can hire people who located outside of Russia or Belarus.
#vacancy#fulltime#hybrid#moscow
#headofdatascience#datascience#RecSys
Head of Data Science (RecSys)
Мы ищем опытного Head of Data Science, специализирующегося на Dating/Video сервисах. Если у вас есть экспертиза в создании рекомендательных систем для видеоконтента и вы готовы возглавить весь цикл разработки, мы будем рады рассмотреть вашу кандидатуру.
Чем предстоит заниматься:
- Отвечать за весь процесс разработки рекомендательных систем для видеосервисов.
- Разрабатывать, обучать и внедрять модели машинного обучения.
- Оценивать эффективность моделей и находить пути для их улучшения.
- Развивать и поддерживать автоматизированные процессы обучения и прогнозирования.
- Интегрировать модели в рабочие системы (через API, ETL-процессы).
- Тесно взаимодействовать с командами аналитики, инженерами данных и бизнес-менеджерами.
- Выявлять скрытые закономерности и тренды в данных для повышения качества рекомендаций.
Требования:
- Опыт работы от 3 лет в сфере video/streaming.
- Успешный опыт разработки рекомендательных систем для видеоплатформ и таргетирования видеоконтента.
- Опыт взаимодействия с бизнесом для сбора и формализации требований.
- Уверенное владение SQL.
- Отличное знание Python и библиотек для анализа данных (pandas, scikit-learn, xgboost).
- Глубокое понимание основ теории вероятностей, математической статистики и машинного обучения.
Мы предлагаем:
- Трудоустройство по ИП РФ.
- Конкурентную заработную плату от 450.000 до 600.000 р
- Гибридный формат работы в Москве.
Резюме направлять: @sourserXP
#vacancy
#вакансия#ml#engineer#ds#pytorch#tensorflow#recsys#highload
⭐️Компания: Wisebits
🔥Позиция: Senior ML Engineer / Data Scientist (Search & Recommendations)
🏢Формат работы: full time, удаленно/relocate
💰 Зарплата: от 4500 euro net (обсуждаемо)
Wisebits — международный IT-холдинг с сильной технической командой!
Наш ключевой продукт — высоконагруженный видеохостинг, которым ежедневно пользуются миллионы людей по всему миру. Более чем за 15 лет на рынке мы сформировали профессиональную команду, где ценятся вовлечённость и инициативность.
Если хочешь работать с high-load продуктом и иметь возможность влиять на его развитие — присоединяйся к нам!
❇️Чем предстоит заниматься:
• Разрабатывать рекомендательные системы: user-item, item-item, кросс-платформенные рекомендации;
• Исследовать и внедрять стратегии exploration-exploitation;
• Оптимизировать выдачу на страницах категорий, каналов и тегов;
• Строить text-to-video поиск: семантический поиск, embedding-модели, ранжирование;
• Адаптировать и оптимизировать модели под высокую нагрузку — десятки тысяч RPS.
❇️Что мы ожидаем от тебя:
• Опыт работы с рекомендательными системами, поиском или смежными задачами от 2 лет;
• Уверенные знания Python и ML-фреймворков (PyTorch, LightGBM и др.);
• Опыт внедрения моделей в продакшн;
• Понимание принципов оффлайн- и онлайн-оценки моделей.
❇️Что мы предлагаем:
• Работа над ML-продуктом с миллионами пользователей и живыми метриками;
• Команда сильных инженеров, с которыми интересно дискутировать, совместно размышлять и запускать новые проекты и фичи;
• Простая структура — минимум бюрократии, максимум ответственности;
• Стабильная зарплата, ежегодный рейз и премии.
• Бонусы: медстраховка, налоговая компенсация, обучение, техника, курсы языков;
• Релокация на Кипр: визовая поддержка, оплата переезда, билеты и первый месяц жилья;
• Гибкий график, комфортная атмосфера и поддержка команды.
❇️Наш стек:
Языки и библиотеки: Python, PyTorch, LightGBM, Numpy, Pandas, Polars, CuDF, CuPy
Инфраструктура и деплой: Kubernetes, Docker, Airflow, Triton Inference Server
Хранилища данных: ClickHouse, MySQL
Резюме можно направлять в лс https://t.me/Ullallaa💫
#ТБанк#вакансия#ML#NLP#NaturalLanguageProcessing#LLM#RecSys#CV#senior#middle
Ищем ML-engineer в Т-Банк
💻
Мы создаем и применяем AI-технологии для развития финансовой экосистемы Т-Банка: внедряем в продукты и внутренние процессы компании, делаем решения качественнее, безопаснее и удобнее для пользователей, вкладываемся в долгосрочные исследования.
Кратко про работу в команде:
▪️Делимся опытом во всех областях машинного обучения - рекомендации, компьютерное зрение, голосовые технологии и работа с текстом и языком.
▪️Даем возможность как закидывать наработки в прод на миллионы пользователей, так и проводить исследования в своей области.
▪️Фокусируемся на принципе AI-first и не копим легаси.
▪️Оплачиваем участие в топовых AI-конференциях 2-3 раза в год.
Основные задачи:
- Изучать научные статьи, генерировать гипотезы, ставить на их основе эксперименты и доносить результат до команды.
- Улучшать качество моделей в различных сценариях.
- Ускорять работу моделей, применяя современные методы оптимизации и построения архитектуры.
- Писать воспроизводимый код, оформлять эксперименты в воспроизводимые пайплайны, включающие разметку и обработку данных, обучение моделей и валидацию системы в целом.
Ожидания по опыту:
- Опыт работы от 2-х лет в индустриальных ML проектах, обязателен опыт доставки предсказаний и моделей до прода).
- Опыт разработки моделей с использованием современных DL-фреймворков (Pytorch, Jax/Tensorflow и других) и их применения в продакшене.
- Разбираетесь в принципах работы современных алгоритмов машинного обучения.
- Умеете декомпозировать задачу в переиспользуемые и тестируемые библиотеки и компоненты.
- Знаете теорию в сфере математики, прикладной статистики, алгоритмов и структур данных.
- Готовы изучать научные статьи на английском языке и ставить эксперименты на основе прочитанного.
- Знаете Linux, Git, Bash и Docker.
Мы предлагаем:
▫️Гибридный формат работы в РФ.
▫️Платформу обучения и развития «Т-Апгрейд». Курсы, тренинги, вебинары и базы знаний. Поддержку менторов и наставников, помощь в поиске точек роста и карьерном развитии.
▫️Заботу о здоровье. Оформим полис ДМС со стоматологией и страховку от несчастных случаев.
▫️Возможность работы в аккредитованной ИТ-компании.
▫️Сервисы для поддержки сотрудника по психологическим, юридическим и финансовым вопросам.
▫️Три дополнительных дня отпуска в год.
▫️Достойную зарплату — обсудим ее на собеседовании.
Присылайте резюме и вопросы мне в tg @aetern1tas. Буду рада ответить на вопросы и сориентировать по вакансиям 💻
#ТБанк#вакансия#ML#NLP#NaturalLanguageProcessing#LLM#RecSys#CV#senior#middle
Ищем ML-engineer в Т-Банк 👋
Мы создаем и применяем AI-технологии для развития финансовой экосистемы Т-Банка: внедряем в продукты и внутренние процессы компании, делаем решения качественнее, безопаснее и удобнее для пользователей, вкладываемся в долгосрочные исследования.
Кратко про работу в команде:
▪️Делимся опытом во всех областях машинного обучения - рекомендации, компьютерное зрение, голосовые технологии и работа с текстом и языком.
▪️Даем возможность как закидывать наработки в прод на миллионы пользователей, так и проводить исследования в своей области.
▪️Фокусируемся на принципе AI-first и не копим легаси.
▪️Оплачиваем участие в топовых AI-конференциях 2-3 раза в год.
Основные задачи:
- Изучать научные статьи, генерировать гипотезы, ставить на их основе эксперименты и доносить результат до команды.
- Улучшать качество моделей в различных сценариях.
- Ускорять работу моделей, применяя современные методы оптимизации и построения архитектуры.
- Писать воспроизводимый код, оформлять эксперименты в воспроизводимые пайплайны, включающие разметку и обработку данных, обучение моделей и валидацию системы в целом.
Ожидания по опыту:
- Опыт работы от 2-х лет в индустриальных ML проектах (включая этап доставки предсказаний и моделей до прода)
У вас есть опыт разработки моделей с использованием современных DL-фреймворков (Pytorch, Jax/Tensorflow и других) и их применения в продакшене.
- Разбираетесь в принципах работы современных алгоритмов машинного обучения.
- Умеете декомпозировать задачу в переиспользуемые и тестируемые библиотеки и компоненты.
- Знаете теорию в сфере математики, прикладной статистики, алгоритмов и структур данных.
- Готовы изучать научные статьи на английском языке и ставить эксперименты на основе прочитанного.
- Знаете Linux, Git, Bash и Docker.
Мы предлагаем:
▫️Гибридный формат работы.
▫️Платформу обучения и развития «Т-Апгрейд». Курсы, тренинги, вебинары и базы знаний. Поддержку менторов и наставников, помощь в поиске точек роста и карьерном развитии.
▫️Заботу о здоровье. Оформим полис ДМС со стоматологией и страховку от несчастных случаев.
▫️Возможность работы в аккредитованной ИТ-компании.
▫️Сервисы для поддержки сотрудника по психологическим, юридическим и финансовым вопросам.
▫️Три дополнительных дня отпуска в год.
▫️Достойную зарплату — обсудим ее на собеседовании.
Присылайте резюме и вопросы мне в tg @aetern1tas или на почту [email protected]. Буду рада ответить на вопросы и сориентировать по вакансиям
💻
#ТБанк#вакансия#ML#NLP#NaturalLanguageProcessing#LLM#RecSys#CV#senior#middle
Ищем ML-engineer в Т-Банк 👋
Мы создаем и применяем AI-технологии для развития финансовой экосистемы Т-Банка: внедряем в продукты и внутренние процессы компании, делаем решения качественнее, безопаснее и удобнее для пользователей, вкладываемся в долгосрочные исследования.
Кратко про работу в команде:
▪️Делимся опытом во всех областях машинного обучения - рекомендации, компьютерное зрение, голосовые технологии и работа с текстом и языком.
▪️Даем возможность как закидывать наработки в прод на миллионы пользователей, так и проводить исследования в своей области.
▪️Фокусируемся на принципе AI-first и не копим легаси.
▪️Оплачиваем участие в топовых AI-конференциях 2-3 раза в год.
Основные задачи:
- Изучать научные статьи, генерировать гипотезы, ставить на их основе эксперименты и доносить результат до команды.
- Улучшать качество моделей в различных сценариях.
- Ускорять работу моделей, применяя современные методы оптимизации и построения архитектуры.
- Писать воспроизводимый код, оформлять эксперименты в воспроизводимые пайплайны, включающие разметку и обработку данных, обучение моделей и валидацию системы в целом.
Ожидания по опыту:
- Опыт работы от 2-х лет в индустриальных ML проектах (включая этап доставки предсказаний и моделей до прода)
У вас есть опыт разработки моделей с использованием современных DL-фреймворков (Pytorch, Jax/Tensorflow и других) и их применения в продакшене.
- Разбираетесь в принципах работы современных алгоритмов машинного обучения.
- Умеете декомпозировать задачу в переиспользуемые и тестируемые библиотеки и компоненты.
- Знаете теорию в сфере математики, прикладной статистики, алгоритмов и структур данных.
- Готовы изучать научные статьи на английском языке и ставить эксперименты на основе прочитанного.
- Знаете Linux, Git, Bash и Docker.
Мы предлагаем:
▫️Гибридный формат работы.
▫️Платформу обучения и развития «Т-Апгрейд». Курсы, тренинги, вебинары и базы знаний. Поддержку менторов и наставников, помощь в поиске точек роста и карьерном развитии.
▫️Заботу о здоровье. Оформим полис ДМС со стоматологией и страховку от несчастных случаев.
▫️Возможность работы в аккредитованной ИТ-компании.
▫️Сервисы для поддержки сотрудника по психологическим, юридическим и финансовым вопросам.
▫️Три дополнительных дня отпуска в год.
▫️Достойную зарплату — обсудим ее на собеседовании.
Присылайте резюме и вопросы мне в tg @aetern1tas или на почту [email protected]. Буду рада ответить на вопросы и сориентировать по вакансиям
💻
#ТБанк#вакансия#ML#NLP#NaturalLanguageProcessing#LLM#RecSys#CV#senior#middle
Ищем ML-engineer в Т-Банк 👋
Мы создаем и применяем AI-технологии для развития финансовой экосистемы Т-Банка: внедряем в продукты и внутренние процессы компании, делаем решения качественнее, безопаснее и удобнее для пользователей, вкладываемся в долгосрочные исследования.
Кратко про работу в команде:
▪️Делимся опытом во всех областях машинного обучения - рекомендации, компьютерное зрение, голосовые технологии и работа с текстом и языком.
▪️Даем возможность как закидывать наработки в прод на миллионы пользователей, так и проводить исследования в своей области.
▪️Фокусируемся на принципе AI-first и не копим легаси.
▪️Оплачиваем участие в топовых AI-конференциях 2-3 раза в год.
Основные задачи:
- Изучать научные статьи, генерировать гипотезы, ставить на их основе эксперименты и доносить результат до команды.
- Улучшать качество моделей в различных сценариях.
- Ускорять работу моделей, применяя современные методы оптимизации и построения архитектуры.
- Писать воспроизводимый код, оформлять эксперименты в воспроизводимые пайплайны, включающие разметку и обработку данных, обучение моделей и валидацию системы в целом.
Ожидания по опыту:
- У вас есть опыт разработки моделей с использованием современных DL-фреймворков (Pytorch, Jax/Tensorflow и других) и их применения в продакшене.
- Разбираетесь в принципах работы современных алгоритмов машинного обучения.
- Умеете декомпозировать задачу в переиспользуемые и тестируемые библиотеки и компоненты.
- Знаете теорию в сфере математики, прикладной статистики, алгоритмов и структур данных.
- Готовы изучать научные статьи на английском языке и ставить эксперименты на основе прочитанного.
- Знаете Linux, Git, Bash и Docker.
Мы предлагаем:
▫️Гибридный формат работы.
▫️Платформу обучения и развития «Т-Апгрейд». Курсы, тренинги, вебинары и базы знаний. Поддержку менторов и наставников, помощь в поиске точек роста и карьерном развитии.
▫️Заботу о здоровье. Оформим полис ДМС со стоматологией и страховку от несчастных случаев.
▫️Возможность работы в аккредитованной ИТ-компании.
▫️Сервисы для поддержки сотрудника по психологическим, юридическим и финансовым вопросам.
▫️Три дополнительных дня отпуска в год.
▫️Достойную зарплату — обсудим ее на собеседовании.
Присылайте резюме и вопросы мне в tg @aetern1tas или на почту [email protected]. Буду рада ответить на вопросы и сориентировать по вакансии
💻
Okko ищет Senior Data Scientist RecSys
#вакансия#vacancy#datascientist#datascience#ml#machinelearning#RecSys#мск#спб#гибрид#hybrid#remote#удаленка
Мы создаём рекомендательную систему, которая является одним из ключевых ML–сервисов в Okko.
Простые задачи мы уже решили, остались интересные. Поэтому мы ищем специалиста с обширным опытом работы.
ЗП: 400 000 - 500 000 gross (с успешным кандидатом готовы обсуждать)
Формат работы: гибрид (офисы в Мск и Спб) или удаленка
Стэк: Python, Pytorch, AirFLow, ClickHouse
🟣Обязанности:
▫️исследование и реализация алгоритмов и практик машинного обучения в рекомендательных сценариях Okko;
▫️анализ исходных данных и результатов экспериментов с моделями.
🟣Требования:
▫️аналитические навыки, понимание принципов А/В тестирования;
▫️знание базовых алгоритмов и структур данных, знание Python и библиотек (numpy, pandas);
▫️знание классических ML алгоритмов (от линейных моделей до градиентного бустинга) и метрик классификации, регрессии, ранжирования;
▫️опыт разработки моделей от подготовки данных до продакшна;
▫️понимание работы современных нейросетей;
▫️знание свёрточных нейросетей и трансформеров для самостоятельного использования;
▫️умение оформлять и презентовать результаты работы.
🟣Будет плюсом:
▫️опыт распределённого обучения трансформеров;
▫️знание SOTA практик, чтение статей;
▫️опыт в NLP, IR, CV, ASR, TTS или RL;
▫️понимание обучения моделей на GPU;
▫️понимание специфики обучения LLM;
▫️опыт со Spark.
🟣Условия:
▫️в распоряжении сервера с A100 (80GB) и данные сервиса с миллионами пользователей;
▫️ классное оборудование и необходимый софт;
▫️работа в команде с топовыми специалистами;
▫️выделенные команды DWH, аналитиков, разработки и DevOps/MLOps для поддержки в сборе данных, экспериментах и инфраструктуре;
▫️риндинг группы, внутренние курсы по RL, ReсSys и аналитике;
▫️ДМС со стоматологией, корпоративные скидки, льготная ипотека в рамках зарплатного проекта, подписка на сервисы партнеров.
Контакты: @alina_katkova😊
#vacancy#relocation#Serbia#Netherland#работа#fulltime#ML#LLM#RecSys#DL#English
Мы в поисках Senior ML Researcher-а в молодой инновационный стартап в области искусственного интеллекта, который строит фундаментальную ML-модель для анализа финансовых рынков.
Речь идёт не о ещё одном fine-tuning LLM. Команда строит универсальную foundation модель, способную одновременно работать с текстом, временными рядами и числовыми данными — с акцентом на решение сложных задач прогнозирования. Первое приложение — финансовые рынки, но архитектура задумана как масштабируемая и мультимодальная, с потенциалом выхода далеко за рамки финтеха.
У стартапа уже есть прямой доступ к новой архитектуре серверов, альтернативной современным GPU-решениям. Это даёт команде эксклюзивную возможность тестировать и масштабировать модели на инновационной инфраструктуре — за шаг до рынка.
В проекте участвует ведущий профессор в области foundation моделей, профессор одного из топовых университетов Канады (U de Montréal and Milal). Она — автор множества публикаций с высокой цитируемостью, регулярный участник NeurIPS и других престижных конференций. Её вклад в проект — один из ключевых активов, привлекающих сильных исследователей.
Важно:
• 5+ лет в ML/Deep Learning;
• Опыт работы с большими моделями (LLM, Transformers, Time Series);
• Опыт в финансах;
• Умение читать и быстро применять научные статьи;
• Свободное владение английским языком от B2;
• Приоритетные области: deep learning, Recsys.
🎯 Что вас ждёт:
💰 Зарплата: €180k – €200k gross в год;
🚀 Релокация в Сербию или Нидерланды. Коллеги также готовы обсуждать возможность работать удалённо для опытных кандидатов в индивидуальном порядке
📩 Присылайте ваше резюме в telegram: @veronikavlasovets
Иногда Telegram подводит — сообщения могут теряться. Если вы не получили ответ в течение 3 дней, то продублируйте запрос на email: [email protected]
Всем привет!
Мы в Okko расширяем департамент анализа данных. Сейчас в команде больше 50 человек, мы продолжаем расти, совершенствуя работу с данными, в т.ч. рекомендательную систему. Поэтому ищем близких по духу людей, вместе с которыми создадим принципиально новый подход к зрительскому опыту.
Мы ждем Data Scientists, Data Analysts, Data Engineers, Python Developers и т.д. уровня middle+/senior. Можно выбрать направление – «Платформа экспериментов», «Рекомендации», «Поиск», «Монетизация», «Growth», «Контент», «Техническая команда».
Сделали страничку со всеми подробностями, там же можно откликнуться на понравившуюся вакансию: https://analytics.okko.tv/
Ждем твой отклик
#data#datascientists#dataanalysts#dataengineers#ds#da#de#ml#recsys#recommendations#search#datadriven#AB#growth#okko