TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #309 · 2 фев.

Метод строки split() разделяет строку на несколько строк по указанному символу >>> "a_b_c".split('_') ['a', 'b', 'c'] Можно указать максимальное количество разделений >>> "a_b_c".split('_', 1) ['a', 'b_c'] Или резать с другой стороны с помощью rsplit() (right split) >>> "a_b_c".rsplit('_', 1) ['a_b', 'c'] А что будет если оставить аргументы пустыми? >>> "a_b_c".split() ['a_b_c'] Получаем список с одним элементом, потому что по умолчанию используется пробельный символ. >>> "a b c".split() ['a', 'b', 'c'] То есть это равнозначно такому вызову? >>> "a b c".split(" ") ['a', 'b', 'c'] Кажется да, но нет! Давайте попробуем добавить пробелов между буквами >>> "a b c".split(" ") ['a', '', '', 'b', '', '', 'c'] И вот картина уже не так предсказуема 😕 А вот что будет по умолчанию >>> "a b c".split() ['a', 'b', 'c'] Всё снова красиво! 🤩 По умолчанию в качестве разделителя используется любой пробельный символ, будь то табуляция или новая строка. Включая несколько таких символов идущих подряд. А также игнорируются пробельные символы по краям строки. >>> "a\t b\n c ".split() ['a', 'b', 'c'] Аналогичный способ можно собрать с помощью регулярного выражения. Но пробелы по краям строки придется обрабатывать дополнительно. >>> import re >>> re.split(r"\s+", ' a b c '.strip()) ['a', 'b', 'c'] Здесь тоже можно указать количество разделений >>> re.split(r"\s+", 'a b c', 1) ['a', 'b c'] А что если мы хотим написать красиво, то есть split() без аргументов, но при этом указать количество разделений? В этом случае первым аргументом передаём None >>> "a\n b c".split(None, 1) ['a', 'b c'] Данный метод не учитывает строки с пробелами, взятые в кавычки 'a "b c" '.split() ['a', '"b', 'c"'] Но для таких случаев есть другие способы. #tricks#basic

Резултати

Пронајдени 1 слични објави

Пребарај: #meltano

当前筛选 #meltano清除筛选
Data Science Jobs

@datasciencejobs · Post #2660 · 11.04.2025 г., 09:35

#ВакансияData Engineer #Meltano#PostgreSQL#Mongodb#Elasticsearch Формат: Удаленный / Гибрид Вилка: от 180 000 рублей до 250 000 рублей net Локация: РФ Привет! 🙂 Меня зовут Евгения и я HR бизнес-партнер в компании Aplaut. Мы - продуктовая MarTech компания для eCommerce, лидер на Российском рынке среди сервисов по управлению UGC. Наши клиенты входят в топ-100 отечественного eCommerce: Спортмастер, Лемана Про (Леруа Мерлен), Эльдорадо, Ситилинк и т.д. Сейчас ищем крутого Data Engineer для нашей продуктовой команды. Твоя задача – совместно с DevOps и аналитиком развивать и совершенствовать архитектуру Data Lake и DWH, создавать и оптимизировать ETL/ELT пайплайны и обеспечивать корректную интеграцию данных из различных источников. Ты активно будешь взаимодействовать с разработчиками, менеджером продукта и своим главным боссом - Техническим директором. Мы работаем по Scrum — у нас короткие спринты, четкие приоритеты и минимум встреч. Задачи: - Разрабатывать, оптимизировать и поддерживать ETL/ELT-процессы на базе Meltano. - Интегрировать данные из REST API, баз данных, файловых хранилищ. - Разрабатывать и поддерживать кастомные Meltano taps и targets. - Работать с PostgreSQL, Mongodb, Elasticsearch и другими хранилищами. - Автоматизировать обработку данных с использованием Dagster. - Оптимизировать производительность data pipelines. - Обеспечивать контроль качества данных, работать с метриками и мониторингом. Мы ждем, что у тебя: - Опыт работы Data Engineer от 2 лет. - Уверенные знания Python и его экосистемы для работы с данными (pandas, SQLAlchemy, requests). - Опыт работы с Meltano (настройка, разработка кастомных taps/targets, интеграция). - Опыт работы с dbt. - Знание SQL и реляционных баз данных (PostgreSQL, MySQL). - Опыт работы с облачными платформами. - Опыт работы с Dagster (настройка и оркестрация data pipelines). - Опыт работы с форматами данных (JSON/Parquet/ Avro/CSV). - Уверенные знания Docker. Как плюс: - Опыт работы с Kafka. - Опыт построения data lake и dwh архитектур. Почему мы? - Мы работаем над собственными продуктами небольшой командой и являемся лидером рынка в сегменте UGC. - У нас прозрачные бизнес-процессы, отсутствие микроменеджмента, минимум бюрократии и свобода в принятии решений. - Ты быстро увидишь результаты своей работы, в отличии от корпораций. - Стремимся к достижению амбициозных целей. Что мы предлагаем: - Аккредитованная ИТ компания. - Официальное оформление по ТК с первого дня, есть возможность оформления как самозанятый. - Гибкий график работы. - Удаленный формат работы для сотрудников из регионов и гибрид для сотрудников из Москвы. - Уютный лофт-офис в 5 минутах пешком от метро Электрозаводская. - Финансирование обучения для сотрудников и профессиональная литература за счет компании. - Возможность использовать sick day вместо больничного 5 дней в году. - Лучшая команда, которая всегда придет на помощь. - Насыщенная корпоративная жизнь. Для связи: @Evgenika_hr