Функция sub в regex может принимать функцию в качестве аргумента repl.
📄 Из документации:
If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string.
То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений.
Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений.
Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере:
Создаем карту замены. То есть какие строки на какие требуется менять.
remap = {
'раз': '1',
'два': '2',
'три': '3',
'четыре': '4',
'пять': '5',
}
Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match.
Используя данные этого объекта мы вычисляем замену on-the-fly!
def get_str(match: re.Match):
word = match.group(1)
return remap.get(word.lower()) or word
Пример текста.
text = '''Раз Два Три Четыре Пять
Вместе будем мы считать
Пять Четыре Три Два Раз
Мы считать научим вас
'''
Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции.
(Данный паттерн ищет отдельные слова в тексте)
>>> print(re.sub(r'(\w+)', get_str, text))
1 2 3 4 5
Вместе будем мы считать
5 4 3 2 1
Мы считать научим вас
Думаю, достаточно наглядно 🤓
#libs#regex
#TIL – MILLAT KO‘RKI
21-oktyabr – o‘zbek tili bayrami kuni barchamizga muborak bo‘lsin!
O‘zlikni anglash, milliy ong va tafakkurning ifodasi, avlodlar o‘rtasidagi ruhiy-ma’naviy bog‘liqlik til orqali namoyon bo‘ladi. Jamiki ezgu fazilatlar inson qalbiga, avvalo, ona allasi, ona tilining betakror jozibasi bilan singadi.
Ona tili – bu millatning ruhidir.
Sizlarni yurtimiz tarixidagi muhim sanalardan biri – O‘zbek tili bayrami kuni bilan chin qalbdan muborakbod etamiz!
Ushbu ulug‘ bayram barchamizga quvonch, faxr va g‘urur ulashsin! Ona tilimiz abadiy yashasin, doimo barhayot bo‘lsin!
😎Telegram |🌐Websayt
😎Facebook |😎YouTube|😎Instagram
#TIL there are laws mandate the use of a specific font.
[... A]ny text that is displayed on a primary package or secondary package, or on any overwrap covering the package, must [...] be printed in a regular weight and width Lucida Sans Serif font style, without italics, and in gray.
https://gazette.gc.ca/rp-pr/p2/2019/2019-05-01/html/sor-dors107-eng.html🐟