TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #335 · 29 мар.

В Linux стандартными средствами можно использовать часть оперативной памяти как диск. Для этого требуется указать тип монтирования tmpfs в команде mount mount -t tmpfs -o size=5G tmpfs /mnt/ram Теперь путь /mnt/ram можно использовать как обычный каталог. Для чего это может быть нужно? ▫️ Скорость работы с таким каталогом выше чем многие SSD и тем более HDD. ▫️ Если у вас очень быстрый SSD на NVMe M.2 то такой способ особо не прибавит вам скорости, но поможет сохранить ресурс SSD когда требуется обрабатывать очень много мелких файлов и оперативка позволяет выделить нужный объем. ▫️ Оперативка это энергозависимая память, поэтому выключении питания все файлы безвозвратно теряются. Такой "non persistent" каталог гарантирует удаление временных файлов. Я написал небольшой скрипт для условного теста и сравнения скорости копирования файлов между SSD и RAM. Вот мои результаты: Single File Size: 30.0Gb ssd > ssd: 0:00:12.850 / 2.3Gb/s sdd > ram: 0:00:06.453 / 4.6Gb/s ram > ram: 0:00:06.995 / 4.3Gb/s ram > sdd: 0:00:06.217 / 4.8Gb/s Dir size: 32.7Gb, File count: 11127 ssd > ssd: 0:00:15.063 / 2.2Gb/s sdd > ram: 0:00:08.486 / 3.9Gb/s ram > ram: 0:00:08.032 / 4.1Gb/s ram > sdd: 0:00:07.026 / 4.7Gb/s Скрипт для теста ↗️ На моём железе прирост скорости ~2x. Плюс экономия ресурса SSD. В Windows такой фишки по умолчанию нет, но обязательно найдутся аналогичные решения #linux#triks

Hashtags

Резултати

Пронајдени 1 слични објави

Пребарај: #meltano

当前筛选 #meltano清除筛选
Data Science Jobs

@datasciencejobs · Post #2660 · 11.04.2025 г., 09:35

#ВакансияData Engineer #Meltano#PostgreSQL#Mongodb#Elasticsearch Формат: Удаленный / Гибрид Вилка: от 180 000 рублей до 250 000 рублей net Локация: РФ Привет! 🙂 Меня зовут Евгения и я HR бизнес-партнер в компании Aplaut. Мы - продуктовая MarTech компания для eCommerce, лидер на Российском рынке среди сервисов по управлению UGC. Наши клиенты входят в топ-100 отечественного eCommerce: Спортмастер, Лемана Про (Леруа Мерлен), Эльдорадо, Ситилинк и т.д. Сейчас ищем крутого Data Engineer для нашей продуктовой команды. Твоя задача – совместно с DevOps и аналитиком развивать и совершенствовать архитектуру Data Lake и DWH, создавать и оптимизировать ETL/ELT пайплайны и обеспечивать корректную интеграцию данных из различных источников. Ты активно будешь взаимодействовать с разработчиками, менеджером продукта и своим главным боссом - Техническим директором. Мы работаем по Scrum — у нас короткие спринты, четкие приоритеты и минимум встреч. Задачи: - Разрабатывать, оптимизировать и поддерживать ETL/ELT-процессы на базе Meltano. - Интегрировать данные из REST API, баз данных, файловых хранилищ. - Разрабатывать и поддерживать кастомные Meltano taps и targets. - Работать с PostgreSQL, Mongodb, Elasticsearch и другими хранилищами. - Автоматизировать обработку данных с использованием Dagster. - Оптимизировать производительность data pipelines. - Обеспечивать контроль качества данных, работать с метриками и мониторингом. Мы ждем, что у тебя: - Опыт работы Data Engineer от 2 лет. - Уверенные знания Python и его экосистемы для работы с данными (pandas, SQLAlchemy, requests). - Опыт работы с Meltano (настройка, разработка кастомных taps/targets, интеграция). - Опыт работы с dbt. - Знание SQL и реляционных баз данных (PostgreSQL, MySQL). - Опыт работы с облачными платформами. - Опыт работы с Dagster (настройка и оркестрация data pipelines). - Опыт работы с форматами данных (JSON/Parquet/ Avro/CSV). - Уверенные знания Docker. Как плюс: - Опыт работы с Kafka. - Опыт построения data lake и dwh архитектур. Почему мы? - Мы работаем над собственными продуктами небольшой командой и являемся лидером рынка в сегменте UGC. - У нас прозрачные бизнес-процессы, отсутствие микроменеджмента, минимум бюрократии и свобода в принятии решений. - Ты быстро увидишь результаты своей работы, в отличии от корпораций. - Стремимся к достижению амбициозных целей. Что мы предлагаем: - Аккредитованная ИТ компания. - Официальное оформление по ТК с первого дня, есть возможность оформления как самозанятый. - Гибкий график работы. - Удаленный формат работы для сотрудников из регионов и гибрид для сотрудников из Москвы. - Уютный лофт-офис в 5 минутах пешком от метро Электрозаводская. - Финансирование обучения для сотрудников и профессиональная литература за счет компании. - Возможность использовать sick day вместо больничного 5 дней в году. - Лучшая команда, которая всегда придет на помощь. - Насыщенная корпоративная жизнь. Для связи: @Evgenika_hr