TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #22 · 19 јан.

Заметка начинающим, которые часто сталкиваются с подобной непоняткой. Ситуация следующая, есть список файлов: names = [ 'image.bmp', 'second.txt.bkp', 'data.db', '.config.cfg', 'file.ext.bkp' ] И мы хотим убрать у них окончание ".bkp". Не знаю зачем, пример довольно надуманный) Но суть он показывает, а это главное. Те, кто еще не очень знаком с библиотекой os.path или pathlib, вероятно решат обработать имена как строки. И тут вполне подойдет метод строки strip(). Что делает этот метод? Он отрезает указанные символы по обеим сторонам строки. Если ничего не указать, то убирает невидимые символы (пробелы, табуляции и переносы строк). В нашем случае будет выглядеть вот так: >>> name.strip('.bkp') То есть просим удалить строку '.bkp' по краям имени файла, если таковая есть. Можно применить аналогичный метод rstrip(), чтобы отрезать только справа, но для этого примера используем обычный. >>> for name in names: >>> print(name.strip('.bkp')) image.bm second.txt data.d config.cfg file.ext Хм, что-то не то с нашими именами! Что случилось??? Видим нежелательное переименование в именах, где и близко не было указанной строки '.bkp' А дело всё в том, что данный метод ищет не указанную строку, а указанные символы, и не важно в каком порядке. Для метода strip() строка '.bkp' это не паттерн для поискаа список символов. Потому он отрезал симовол 'p' от '.bmp' и удалил точку из файла '.config.cfg'. Как тогда правильно заменить именно паттерн? Для начинающего можно посоветовать метод строки replace(), который как раз использует для замены указанную строку целиком. В нашем примере заменим её на пустую строку. >>> for name in names: >>> print(name.replace('.bkp', '')) image.bmp second.txt data.db .config.cfg file.ext Уже лучше, но помните, это лишь пример про strip(). Для работы с именами файлов есть способы и более "правильные", дающие однозначно верный результат. Я взял файлы только в качестве примера. Даже replase() тут может сделать не то что ожидаем. Просто впредь будьте внимательны с этим strip(). #basic

Hashtags

Резултати

Пронајдени 2 слични објави

Пребарај: #matching

当前筛选 #matching清除筛选
Data Science Jobs

@datasciencejobs · Post #2751 · 04.06.2025 г., 14:15

#Senior#DataScientist#ML#NLP#LLM#VLM#matching#DS#fulltime#ecommerce Senior Data Scientist (NLP/LLM/VLM) 💼 Ozon Tech 💰 От 455 000 ₽ gross совокупный доход Команда занимается развитием автоматического матчинга — технологии поиска одинаковых товаров как внутри Ozon, так и между Ozon и другими маркетплейсами. В работе — масштабные проекты с использованием LLM, NLP и VLM, направленные на повышение точности и полноты поиска дубликатов и объединения товарных карточек. Основные задачи: — Аналитика текущих проблем матчинга; — Обучение новых NLP-моделей (bi-encoder, late fusion, early fusion); — Адаптация новых LLM/VLM-моделей. Требования: — 4+ лет коммерческого опыта в Data Science; — 2+ года — в задачах NLP; — Опыт обучения и вывода ML-моделей в прод; — Знание современных и классических NLP-подходов; — Уверенное владение Python и PySpark (bigdata датасеты собираем на Hadoop-кластере); — Знание алгоритмов и структур данных; — Проактивность, ответственность, нацеленность на результат. Будет плюсом: — Участие в ML-соревнованиях; — Опыт построения протоколов и пайплайнов разметки данных; — Опыт работы с задачами матчинга / entity resolution. Что предлагаем: — Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce; — Свобода решений, внимание к качеству инженерии; — Сильную профессиональную команду; — Возможность развиваться вместе с бизнесом; — От 455 000 ₽ gross совокупный доход. 📩Контакт: [email protected] — присылай резюме, обсудим детали.