TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #22 · 19 јан.

Заметка начинающим, которые часто сталкиваются с подобной непоняткой. Ситуация следующая, есть список файлов: names = [ 'image.bmp', 'second.txt.bkp', 'data.db', '.config.cfg', 'file.ext.bkp' ] И мы хотим убрать у них окончание ".bkp". Не знаю зачем, пример довольно надуманный) Но суть он показывает, а это главное. Те, кто еще не очень знаком с библиотекой os.path или pathlib, вероятно решат обработать имена как строки. И тут вполне подойдет метод строки strip(). Что делает этот метод? Он отрезает указанные символы по обеим сторонам строки. Если ничего не указать, то убирает невидимые символы (пробелы, табуляции и переносы строк). В нашем случае будет выглядеть вот так: >>> name.strip('.bkp') То есть просим удалить строку '.bkp' по краям имени файла, если таковая есть. Можно применить аналогичный метод rstrip(), чтобы отрезать только справа, но для этого примера используем обычный. >>> for name in names: >>> print(name.strip('.bkp')) image.bm second.txt data.d config.cfg file.ext Хм, что-то не то с нашими именами! Что случилось??? Видим нежелательное переименование в именах, где и близко не было указанной строки '.bkp' А дело всё в том, что данный метод ищет не указанную строку, а указанные символы, и не важно в каком порядке. Для метода strip() строка '.bkp' это не паттерн для поискаа список символов. Потому он отрезал симовол 'p' от '.bmp' и удалил точку из файла '.config.cfg'. Как тогда правильно заменить именно паттерн? Для начинающего можно посоветовать метод строки replace(), который как раз использует для замены указанную строку целиком. В нашем примере заменим её на пустую строку. >>> for name in names: >>> print(name.replace('.bkp', '')) image.bmp second.txt data.db .config.cfg file.ext Уже лучше, но помните, это лишь пример про strip(). Для работы с именами файлов есть способы и более "правильные", дающие однозначно верный результат. Я взял файлы только в качестве примера. Даже replase() тут может сделать не то что ожидаем. Просто впредь будьте внимательны с этим strip(). #basic

Hashtags

Резултати

Пронајдени 1 слични објави

Пребарај: #meltano

当前筛选 #meltano清除筛选
Data Science Jobs

@datasciencejobs · Post #2660 · 11.04.2025 г., 09:35

#ВакансияData Engineer #Meltano#PostgreSQL#Mongodb#Elasticsearch Формат: Удаленный / Гибрид Вилка: от 180 000 рублей до 250 000 рублей net Локация: РФ Привет! 🙂 Меня зовут Евгения и я HR бизнес-партнер в компании Aplaut. Мы - продуктовая MarTech компания для eCommerce, лидер на Российском рынке среди сервисов по управлению UGC. Наши клиенты входят в топ-100 отечественного eCommerce: Спортмастер, Лемана Про (Леруа Мерлен), Эльдорадо, Ситилинк и т.д. Сейчас ищем крутого Data Engineer для нашей продуктовой команды. Твоя задача – совместно с DevOps и аналитиком развивать и совершенствовать архитектуру Data Lake и DWH, создавать и оптимизировать ETL/ELT пайплайны и обеспечивать корректную интеграцию данных из различных источников. Ты активно будешь взаимодействовать с разработчиками, менеджером продукта и своим главным боссом - Техническим директором. Мы работаем по Scrum — у нас короткие спринты, четкие приоритеты и минимум встреч. Задачи: - Разрабатывать, оптимизировать и поддерживать ETL/ELT-процессы на базе Meltano. - Интегрировать данные из REST API, баз данных, файловых хранилищ. - Разрабатывать и поддерживать кастомные Meltano taps и targets. - Работать с PostgreSQL, Mongodb, Elasticsearch и другими хранилищами. - Автоматизировать обработку данных с использованием Dagster. - Оптимизировать производительность data pipelines. - Обеспечивать контроль качества данных, работать с метриками и мониторингом. Мы ждем, что у тебя: - Опыт работы Data Engineer от 2 лет. - Уверенные знания Python и его экосистемы для работы с данными (pandas, SQLAlchemy, requests). - Опыт работы с Meltano (настройка, разработка кастомных taps/targets, интеграция). - Опыт работы с dbt. - Знание SQL и реляционных баз данных (PostgreSQL, MySQL). - Опыт работы с облачными платформами. - Опыт работы с Dagster (настройка и оркестрация data pipelines). - Опыт работы с форматами данных (JSON/Parquet/ Avro/CSV). - Уверенные знания Docker. Как плюс: - Опыт работы с Kafka. - Опыт построения data lake и dwh архитектур. Почему мы? - Мы работаем над собственными продуктами небольшой командой и являемся лидером рынка в сегменте UGC. - У нас прозрачные бизнес-процессы, отсутствие микроменеджмента, минимум бюрократии и свобода в принятии решений. - Ты быстро увидишь результаты своей работы, в отличии от корпораций. - Стремимся к достижению амбициозных целей. Что мы предлагаем: - Аккредитованная ИТ компания. - Официальное оформление по ТК с первого дня, есть возможность оформления как самозанятый. - Гибкий график работы. - Удаленный формат работы для сотрудников из регионов и гибрид для сотрудников из Москвы. - Уютный лофт-офис в 5 минутах пешком от метро Электрозаводская. - Финансирование обучения для сотрудников и профессиональная литература за счет компании. - Возможность использовать sick day вместо больничного 5 дней в году. - Лучшая команда, которая всегда придет на помощь. - Насыщенная корпоративная жизнь. Для связи: @Evgenika_hr