Функция sub в regex может принимать функцию в качестве аргумента repl.
📄 Из документации:
If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string.
То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений.
Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений.
Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере:
Создаем карту замены. То есть какие строки на какие требуется менять.
remap = {
'раз': '1',
'два': '2',
'три': '3',
'четыре': '4',
'пять': '5',
}
Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match.
Используя данные этого объекта мы вычисляем замену on-the-fly!
def get_str(match: re.Match):
word = match.group(1)
return remap.get(word.lower()) or word
Пример текста.
text = '''Раз Два Три Четыре Пять
Вместе будем мы считать
Пять Четыре Три Два Раз
Мы считать научим вас
'''
Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции.
(Данный паттерн ищет отдельные слова в тексте)
>>> print(re.sub(r'(\w+)', get_str, text))
1 2 3 4 5
Вместе будем мы считать
5 4 3 2 1
Мы считать научим вас
Думаю, достаточно наглядно 🤓
#libs#regex
#typescript#fingerprinting#playwright#puppeteer#scraping#typescript
Fingerprint-suite is a toolkit that generates and injects realistic browser fingerprints into automated browsers like Playwright and Puppeteer. It includes four modular packages: header-generator for HTTP headers, fingerprint-generator for browser fingerprints, fingerprint-injector for injection, and a Bayesian network for realistic fingerprint creation. Since websites increasingly use fingerprinting to track and identify users, this tool helps your web scrapers avoid detection by mimicking real browser behavior. You can customize fingerprints by device type and operating system, making your automated browsing appear completely legitimate to anti-bot systems.
https://github.com/apify/fingerprint-suite
С 17 по 20 ноября в Астане на базе Казахстанского филиала МГУ имени М. В. Ломоносова прошла международная конференция «Sediment and pollutants transport in river catchments: monitoring, fingerprinting and source apportionment».
🌍 Мероприятие объединило ученых из России, Казахстана, Италии, Испании, Бельгии, Великобритании, Бразилии, Ирана и Китая.
Ключевой темой дискуссий стала оценка происхождения источников наносов в речных бассейнах, известная как «фингерпринтинг» (от англ. fingerprinting) или трассировка наносов. Если в западных странах этот подход уже интегрирован в практики управления бассейнами рек, то в России он находится на стадии активного становления.
В рамках научной программы были сделаны доклады об использовании радионуклидов (цезий-137, свинец-210) для оценки темпов эрозии, а также о миграции тяжелых металлов и полициклических ароматических углеводородов. Были представлены результаты исследований на самых разных географических объектах: от малых рек Москвы и горных водосборов Кавказа до речных систем Южной Америки, Сибири и Дальнего Востока, и засушливых регионов Центральной Азии.
👩🏻💻👨🏻💻В конференции приняли участие разработчики пакета FingerPro — Ивана Лизага (Ivan Lizaga, Испания) и Летисия Гаспар Феррер (Leticia Gaspar Ferrer, Испания). Состоялся мастер-класс по основам метода фингерпринтинга. Участники семинара смогли на практике разобрать методы интерпретации данных и моделирования для количественной оценки вклада различных источников эрозии при помощи библиотеки FingerPro.
По результатам конференции будет подготовлен специальный выпуск журнала «Известия Русского географического общества», посвященный вопросам миграции наносов и загрязняющих веществ.
📓Сборник материалов по итогам конференции скоро будет доступен на сайте мероприятия: https://sediment.ru/page69546043.html
#конференции#fingerprinting#наносы#эрозия#Астана#МГУ