TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #32 · 7 фев.

Скорее всего уже слышали, что складывать строки через + это плохая практика. Падение производительности, и всё такое. Без лишних слов, давайте измерять: from timeit import timeit def t1(): # складываем 10 строк через + из переменной t = 'text' for _ in range(1000): s = t + t + t + t + t + t + t + t + t def t2(): # склеиваем список строк через метод join arr = ['text'] * 10 for _ in range(1000): s = ''.join(arr) def t3(): # складываем через + но не из переменной а непосредственно инлайн объекты for _ in range(1000): s = 'text' + 'text' + 'text' + ... # всего 10 раз Теперь каждую строку склейки запустим по 10М раз >>> timeit(t1, number=10000) 0.21951690399964718 >>> timeit(t2, number=10000) 1.4978306379998685 >>> timeit(t3, number=10000) 0.2213820789993406 Хм, а нам говорили что через "+" это плохо и медленно ))) 😁 Тут стоит учитывать, что речь идёт о склейке множества длинных строк. Давайте изменим условия: def t4(): t = 'text'*100 for _ in range(1000): s = t + t + t + t + t + t + t + t + t def t5(): arr = ['text'*100] * 10 for _ in range(1000): s = ''.join(arr) def t6(): for _ in range(1000): s = 'text'*100 + 'text'*100 + ... # всего 10 раз >>> timeit(t4, number=10000) 12.795130728000004 >>> timeit(t5, number=10000) 2.642637542999182 >>> timeit(t6, number=10000) 0.2184546610005782 Вот, уже другой разговор, сразу видна разница, в среднем в 6 раз. Но погодите, почему последний тест t6() по скорости такой же как и t3()? Ведь строки теперь в 100 раз длиннее! Это вопросы оптимизации кода, какие простые изменения ускоряют или замедляют выполнение программы. Мы столкнулись с примером обхода обращения к переменной. Например, именно так работает директива #define в С++, во время компиляции подставляя значение переменной вместо ссылки на неё. В Python это тоже работает, но часто ли вы сможете встретить такой способ работы со строками? К сожалению, способ почти только теоретический. В целом, тесты показали то, что мы хотели. Делаем выводы самостоятельно. Полный листинг 🌍 #tricks

Резултати

Пронајдени 1 слични објави

Пребарај: #meltano

当前筛选 #meltano清除筛选
Data Science Jobs

@datasciencejobs · Post #2660 · 11.04.2025 г., 09:35

#ВакансияData Engineer #Meltano#PostgreSQL#Mongodb#Elasticsearch Формат: Удаленный / Гибрид Вилка: от 180 000 рублей до 250 000 рублей net Локация: РФ Привет! 🙂 Меня зовут Евгения и я HR бизнес-партнер в компании Aplaut. Мы - продуктовая MarTech компания для eCommerce, лидер на Российском рынке среди сервисов по управлению UGC. Наши клиенты входят в топ-100 отечественного eCommerce: Спортмастер, Лемана Про (Леруа Мерлен), Эльдорадо, Ситилинк и т.д. Сейчас ищем крутого Data Engineer для нашей продуктовой команды. Твоя задача – совместно с DevOps и аналитиком развивать и совершенствовать архитектуру Data Lake и DWH, создавать и оптимизировать ETL/ELT пайплайны и обеспечивать корректную интеграцию данных из различных источников. Ты активно будешь взаимодействовать с разработчиками, менеджером продукта и своим главным боссом - Техническим директором. Мы работаем по Scrum — у нас короткие спринты, четкие приоритеты и минимум встреч. Задачи: - Разрабатывать, оптимизировать и поддерживать ETL/ELT-процессы на базе Meltano. - Интегрировать данные из REST API, баз данных, файловых хранилищ. - Разрабатывать и поддерживать кастомные Meltano taps и targets. - Работать с PostgreSQL, Mongodb, Elasticsearch и другими хранилищами. - Автоматизировать обработку данных с использованием Dagster. - Оптимизировать производительность data pipelines. - Обеспечивать контроль качества данных, работать с метриками и мониторингом. Мы ждем, что у тебя: - Опыт работы Data Engineer от 2 лет. - Уверенные знания Python и его экосистемы для работы с данными (pandas, SQLAlchemy, requests). - Опыт работы с Meltano (настройка, разработка кастомных taps/targets, интеграция). - Опыт работы с dbt. - Знание SQL и реляционных баз данных (PostgreSQL, MySQL). - Опыт работы с облачными платформами. - Опыт работы с Dagster (настройка и оркестрация data pipelines). - Опыт работы с форматами данных (JSON/Parquet/ Avro/CSV). - Уверенные знания Docker. Как плюс: - Опыт работы с Kafka. - Опыт построения data lake и dwh архитектур. Почему мы? - Мы работаем над собственными продуктами небольшой командой и являемся лидером рынка в сегменте UGC. - У нас прозрачные бизнес-процессы, отсутствие микроменеджмента, минимум бюрократии и свобода в принятии решений. - Ты быстро увидишь результаты своей работы, в отличии от корпораций. - Стремимся к достижению амбициозных целей. Что мы предлагаем: - Аккредитованная ИТ компания. - Официальное оформление по ТК с первого дня, есть возможность оформления как самозанятый. - Гибкий график работы. - Удаленный формат работы для сотрудников из регионов и гибрид для сотрудников из Москвы. - Уютный лофт-офис в 5 минутах пешком от метро Электрозаводская. - Финансирование обучения для сотрудников и профессиональная литература за счет компании. - Возможность использовать sick day вместо больничного 5 дней в году. - Лучшая команда, которая всегда придет на помощь. - Насыщенная корпоративная жизнь. Для связи: @Evgenika_hr