Недавно, как вы знаете, был большой скандал со сливом данных кучи пользователей из Яндекс Еды. Самое неприятное, пожалуй, что утекли адреса людей с точностью до квартиры. У меня почти всех друзей затронуло так или иначе (и меня самого тоже).
Сам слив, как говорят, был вызван саботажем изнутри на фоне последних событий. Независимо от того, какую цель преследовал злоумышленник, навредил он этим всем: адепты любой из сторон конфликта смогут воспользоваться данными для нанесения ущерба своим противникам.
Вина самого Яндекса в утечке представляется мне не очень высокой. Не будет же компания проводить в своих рядах идеологическую проверку, а по её результатам увольнять и лишать доступа. Но в статьях с анализом в основном винят Яндекс за сам факт хранения данных. Видел хорошее объяснение на эту тему: штраф за утечку мизерный, а хранение данных бизнесу выгодно, это может принести прибыль в дальнейшем, даже если прямо сейчас данные не нужны. К тому же, чисто технически сложнее сделать так, чтобы правильно понимать, какие данные оставлять, а какие нет, чем просто тупо записывать всё подряд. Так что это вопрос цифр: "дешевле" хранить, чем не хранить.
Другое дело, как это всё используется. Вчера заказал продукты в Лавке, и мне в заказ положили рекламную "симкарту" от Мегафона. Я не знаю, сколько стоит Мегафону одна такая реклама, возможно, очень дёшево, и поэтому за ней никак не следят. Ведь Лавке совершенно точно известно, что я и так являюсь клиентом Мегафона. Они буквально только что доставили мне этот самый заказ по моему аккаунту, где указан мегафоновский номер.
#life
#GitLab
Modern CI/CD with GitLab: Productivity and Workflow Boost
Your journey to the modern CI/CD with Gitlab starts here! Learn how you can boost your productivity and workflows.
🔗Link
-----
Main channel:@repo_science
Coupons: @freecoupons_reposcience
-----
🦊 Настройка автоматизация проверки качества, сборки и запуск тестов Android проекта в Gitlab
CI/CD - неотъемлемая часть любого мобильного и не только проекта! Даже если вы делаете всё один, вас стоит настроить CI/CD. GitHub, Gitlac, Jenkins и множество других решений подойдут для решения задачи.
Если вы решили использовать CI/CD от Gitlab, тогда вам может пригодиться серия статей:
1️⃣Планирование, настройка Gitlab файла, публикация в Telegram сборок
2️⃣Запуск Android-тестов: Marathon Labs, Firebase Test Lab
3️⃣Автоматизация публикации версий в Play Store с помощью Gradle Play Publisher plugin и Fastlane, а также собственного Docker образа для сборки
#andorid#ci#gitlab#автоматизация
#вакансия#инженер#engineer#DataEngineer#middle#machinelearning#Python#PostgreSQL#SQL#Redis#gitlab#работа#job#удаленно
Компания: Sever X
Формат: удаленно
Занятость: полная, 5/2
💵: от 250 000 руб.
🚀Отличная возможность для опытного Data Engineer реализовать и развить как технические компетенции, так и навыки коммуникации с бизнесом, лидерские качества, навыки формирования команды. С развитием проекта предполагается создание команды под себя, сейчас необходимо возглавить текущие задачи и реализовать их.
🗝задача: поддержка и развитие Data Lake и связанных с ним проектов
📍Основные обязанности
•Интеграция с источниками данных и построение ETL-процессов
•Разработка и поддержка аналитической отчётности системами и API
•Выявление и устранение аномалий в данных
•Взаимодействие с другими членами команды
🛠Стек:
Основной язык разработки – Python 3.8
Платформа разработки – Яндекс.Облако (Managed Services + виртуальные машины)
Хранилища данных – GreenPlum 6.2, PostgreSQL 14, Redis
Оркестратор процессов – Apache Airflow 2.0
Система управления версиями – GitLab
Контейнеризация приложений – Docker + k8s
📍Обязательные требования
•Уверенное владение SQL: базовый синтаксис, транзакции, представления, хранимые процедуры
•Опыт интеграции с различными источниками данных: файловые системы (локальные/ftp/sftp), API, SQL и NoSQL базы данных
•Понимание принципа работы распределённых баз данных
•Знание Python 3: модули pandas, pyodbc (либо другие модули, имплементирующие ODBC), paramiko, requests
•Базовые навыки использования Linux
🔥Преимуществом при отборе будет:
•Опыт работы с распределёнными хранилищами данных: Hadoop (Hive/Impala), GreenPlum, ClickHouse
•Опыт разработки пайплайнов на Apache Airflow
•Навыки оптимизации процессов SQL
•Опыт реализации RestAPI
⚖️Условия работы и что мы можем предложить взамен:
•Место работы: удаленно
•Возможны различные варианты оформления
•Рассматриваются кандидаты в часовом поясе максимум +5 часов к МСК
•Обязательно наличие гражданства РФ
•Квартальные премии в размере 30% от квартального оклада
•ДМС со стоматологией
•Профессиональная и амбициозная команда
•Открытая корпоративная культура, атмосфера доверия и сотрудничества
•Драйв, высокие скорости, непосредственное влияние на результат
📲контакт: @Oskar17