Функция sub в regex может принимать функцию в качестве аргумента repl.
📄 Из документации:
If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string.
То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений.
Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений.
Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере:
Создаем карту замены. То есть какие строки на какие требуется менять.
remap = {
'раз': '1',
'два': '2',
'три': '3',
'четыре': '4',
'пять': '5',
}
Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match.
Используя данные этого объекта мы вычисляем замену on-the-fly!
def get_str(match: re.Match):
word = match.group(1)
return remap.get(word.lower()) or word
Пример текста.
text = '''Раз Два Три Четыре Пять
Вместе будем мы считать
Пять Четыре Три Два Раз
Мы считать научим вас
'''
Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции.
(Данный паттерн ищет отдельные слова в тексте)
>>> print(re.sub(r'(\w+)', get_str, text))
1 2 3 4 5
Вместе будем мы считать
5 4 3 2 1
Мы считать научим вас
Думаю, достаточно наглядно 🤓
#libs#regex
Lookonchain | ꘜ
Whales are accumulating $BGB recently.
0x8900 withdrew 192,668 $BGB($936K) from #Bitget over the past 2 months.
0x171D withdrew 30,607 $BGB($134K) from #Bitget 2 days ago.
0x7C9C withdrew 20,980 $BGB($102K) from #Bitget over the past 3 months.
Notably, #Bitget has burned a total of 860M $BGB($5.25B) over the past 8 months, reducing the total supply by 43%.
https://intel.arkm.com/explorer/address/0x89006C3aADfF87c5113b835660E3459C6Ad61F16
https://intel.arkm.com/explorer/address/0x171D1285a9a8De3f16d4c45706d4E2F4A5C9e175
https://intel.arkm.com/explorer/address/0x7C9C4f9046ba2173fae539FE62eEFAb1aBAD1523