TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #22 · 19 јан.

Заметка начинающим, которые часто сталкиваются с подобной непоняткой. Ситуация следующая, есть список файлов: names = [ 'image.bmp', 'second.txt.bkp', 'data.db', '.config.cfg', 'file.ext.bkp' ] И мы хотим убрать у них окончание ".bkp". Не знаю зачем, пример довольно надуманный) Но суть он показывает, а это главное. Те, кто еще не очень знаком с библиотекой os.path или pathlib, вероятно решат обработать имена как строки. И тут вполне подойдет метод строки strip(). Что делает этот метод? Он отрезает указанные символы по обеим сторонам строки. Если ничего не указать, то убирает невидимые символы (пробелы, табуляции и переносы строк). В нашем случае будет выглядеть вот так: >>> name.strip('.bkp') То есть просим удалить строку '.bkp' по краям имени файла, если таковая есть. Можно применить аналогичный метод rstrip(), чтобы отрезать только справа, но для этого примера используем обычный. >>> for name in names: >>> print(name.strip('.bkp')) image.bm second.txt data.d config.cfg file.ext Хм, что-то не то с нашими именами! Что случилось??? Видим нежелательное переименование в именах, где и близко не было указанной строки '.bkp' А дело всё в том, что данный метод ищет не указанную строку, а указанные символы, и не важно в каком порядке. Для метода strip() строка '.bkp' это не паттерн для поискаа список символов. Потому он отрезал симовол 'p' от '.bmp' и удалил точку из файла '.config.cfg'. Как тогда правильно заменить именно паттерн? Для начинающего можно посоветовать метод строки replace(), который как раз использует для замены указанную строку целиком. В нашем примере заменим её на пустую строку. >>> for name in names: >>> print(name.replace('.bkp', '')) image.bmp second.txt data.db .config.cfg file.ext Уже лучше, но помните, это лишь пример про strip(). Для работы с именами файлов есть способы и более "правильные", дающие однозначно верный результат. Я взял файлы только в качестве примера. Даже replase() тут может сделать не то что ожидаем. Просто впредь будьте внимательны с этим strip(). #basic

Hashtags

Резултати

Пронајдени 26 слични објави

Пребарај: #etl

当前筛选 #etl清除筛选
Data Science Jobs

@datasciencejobs · Post #2071 · 05.05.2024 г., 06:02

#Вакансия#ETL / #DWH Developer Островок — travel-tech компания, создающая платформы онлайн-бронирования отелей, авиабилетов и других услуг как для индивидуальных путешественников, так и для корпоративных клиентов и тревел-агентств. Мы ищем ETL / DWH Developer в команду Data Infrastructure. Команда Data Infrastructure отвечает за сбор, хранение и качество всех данных компании, разработку и поддержку аналитических сервисов и инструментов. На этой позиции у тебя будет возможность отвечать за выделенную доменную область внутри нашего хранилища и улучшать ее структуру. Для этого необходимо иметь опыт работы с колоночными СУБД и доменными областями (финансы / продукт или другими). Обязанности: - Подготовка витрин данных; - Оптимизация SQL-запросов; - Коммуникация с бизнес-аналитиками и формализация задач; - Участие в улучшении архитектуры аналитического хранилища; - Настройка транспортов данных из внешних источников. Обязательные требования: - От 3х лет опыта работы на схожей позиции; - Понимание принципов оптимизации SQL запросов; - Знание Python; - Знания в области архитектуры хранилищ данных (нормальные формы, схема Звезда, Data Vault); - Опыт работы с GIT; - Знание Английского не ниже B1. Будет плюсом: - Опыт работы с колоночными СУБД (у нас Vertica); - Опыт работы с Docker и Airflow; - Опыт работы с Postgres; - Опыт работы с Hadoop Взамен мы предлагаем: - Удаленная работа и/или комфортный офис в центре Москвы с зонами отдыха, безлимитным чаем/кофе и питанием; - Гибридный формат работы: удалённо, из офиса или оба варианта; - Гибкий график — мы не требуем в 9:00 быть в сети или в офисе. Можешь начинать работать в комфортное для тебя время; - Интересные амбициозные задачи, которые выведут тебя на новый профессиональный уровень; - Обучение: семинары, тренинги, конференции. Если ты сам хочешь выступать на конференциях — поможем всё организовать; - ДМС; - Корпоративный английский, а также скидки на SkyEng; - Крутые активности с коллегами: киновечера, викторины, тематические вечеринки, ежегодные выезды на природу, игры в футбол/волейбол; - Корпоративные скидки на отели и другие услуги; - Молодая активная команда классных специалистов. До встречи в Островке! Контакты: @stleona27

Repositorio data science

@repo_science · Post #3080 · 19.04.2023 г., 17:12

#Python#ETL#Database ⚙️ Essential Data Science: Database and ETL With Python Mastering database programming and ETL with Python. Data Processing and Manipulation. 🌐 Inglés ⚖️846MB 🔗Link ----- Canal principal:@repo_science Cupones: @freecoupons_reposcience -----

Repositorio data science

@repo_science · Post #3666 · 19.10.2023 г., 22:39

#ETL#bigData 🤩 Big Data Specialization Specialization - 6 course series 1. Introduction to Big Data 2. Big Data Modeling and Management Systems 3. Big Data Integration and Processing 4. Machine Learning With Big Data 5. Graph Analytics for Big Data 6. Big Data - Capstone Project Skills you will gain - Big Data - Neo4j - Mongodb - Apache Spark ----- Main channel: @repo_science Coupons: @freecoupons_reposcience -----

Hashtags

Repositorio data science

@repo_science · Post #3445 · 16.07.2023 г., 20:38

#ETL#azure#book 🌐 Pro Serverless Data Handling with Microsoft Azure: Architecting ETL and Data-Driven Applications in the Cloud ✍️Benjamin Kettner 📆2022 🔗Link ----- Main channel:@repo_science Coupons:@freecoupons_reposcience -----

Repositorio data science

@repo_science · Post #3076 · 17.04.2023 г., 16:49

#ETL#Python#Talend ⚙️ Snowflake cloud database with ELT(Airflow+Python+Talend) Learn to integrate ETL tools with Snowflake and leverage Airflow for ELT with snowflake.Process 250+ GB data.ELT flow. ⭐️4.3 🌐En 💬En 🔗Link ----- Canal principal:@repo_science Cupones: @freecoupons_reposcience -----

Data Science Jobs

@datasciencejobs · Post #1921 · 16.02.2024 г., 16:02

#вакансия#ETL#разработчик#middle#senior#удаленка Вакансия: Разработчик ETL Формат работы: удалённо Локация: Россия (работа по времени Мск) Занятость: полная Вилка: до 250 000 рублей в месяц Компания: Современные бизнес-аналитические решения ООО Современные бизнес-аналитические решения - аккредитованная ИТ компания, мы входим в холдинг ИТ компаний обеспечивающий полное покрытие требований компаний к BI отчетности и DWH решений Мы приглашаем в нашу команду опытного разработчика для работы над проектом по созданию хранилища данных Обязанности: - Разработка процессов загрузки данных из различных внешних источников - Модификация и оптимизация базы данных PostgreSQL для загрузки данных из внешних и внутренних источников - Создание универсальных ETL процедур и их переиспользование - Помощь в составлении технической документации по разработанным процедурам - Коммуникация с командой разработчиков Требования: - Опыт работы с ETL процессами и уверенное знание SQL - Глубокое понимание работы БД PostgreSQL на низком уровне - Опыт работы с большими объемами данных (более 1 ТБ) - Понимание принципов ООП и знание UML - Опыт работы в команде - Технический английский язык - Высокий уровень технической эрудиции - Опыт разработки на Java или C# - Знание одного из инструментов: IBM DataStage, Informatica PC, Pentaho Data Integrator Мы предлагаем: - Полностью удаленная работа, оформление в штат компании по ТК РФ - Стабильный оклад + пересмотр заработной платы по итогам работы/пройденного обучения - Возможность карьерного роста, профессиональное обучение и сертификацию с оплатой полностью/частично за счёт компании - ДМС для сотрудника и членов его семьи - 13 заработная плата Работаем в сферах: торговля, медицина, банки, страхование Контакт - @irinbik Не забудьте уточнить, что вы из @datasciencejobs

Data Science Jobs

@datasciencejobs · Post #1361 · 13.03.2023 г., 06:30

#офис#вакансия#работа#ETL#DWH#DataEngineer#middle Вилка: от 150 000 руб. до 200 000 руб. gross Офис - Красная Поляна Full-time Наша знакомая - HR Маша (@mashasaiman) находится в поиске Data Engineer уровня middle, который подхватит унаследованную систему (MS стек) ,аккумулирующую информацию в DWH из 10 систем отелей с визуализацией в Power BI. На этом базисе закроем текущие\горящие потребности бизнеса и начнем строить свою систему обработки данных на Industry Standard стеке. Пожелания к кандидату: - Опыт работы DE от 2-х лет; - Знание Python и SQL; - Опыт проектирования и разработки промышленной DWH; - Опыт оркестрации ETL на Airflow или аналогах; - Знания MySQL/PostgreSQL/MSSQL; Будет преимуществом: - Навыки в работе с аналитическими BD; - Понимание принципов потоковой обработки данных; - Облачные технологии. - Навыки работы с BI-системами. Мы предлагаем: - Работу на территории уникальной природной зоны в Красной поляне - Корпоративный трансфер, питание; - Скидки на услуги курорта в кафе/ресторанах/магазинах и развлекательных объектах на территории курорта; - Обучение, тренинги и возможности для профессионального и карьерного роста; - Проживание на льготных условиях в 5 минутах от рабочего места; - Бесплатный ски-пасс на все канатные дороги курорта; - До 200 000 руб. гросс + квартальные премии; - Походы в горы, катание на сноуборде, горных лыжах. Если тебе интересно присоединиться к команде, напиши, обсудим подробности - @mashasaiman Не забудь уточнить, что ты из @datasciencejobs

ПретходнаСтраница 1 од 3Следна