Функция sub в regex может принимать функцию в качестве аргумента repl.
📄 Из документации:
If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string.
То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений.
Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений.
Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере:
Создаем карту замены. То есть какие строки на какие требуется менять.
remap = {
'раз': '1',
'два': '2',
'три': '3',
'четыре': '4',
'пять': '5',
}
Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match.
Используя данные этого объекта мы вычисляем замену on-the-fly!
def get_str(match: re.Match):
word = match.group(1)
return remap.get(word.lower()) or word
Пример текста.
text = '''Раз Два Три Четыре Пять
Вместе будем мы считать
Пять Четыре Три Два Раз
Мы считать научим вас
'''
Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции.
(Данный паттерн ищет отдельные слова в тексте)
>>> print(re.sub(r'(\w+)', get_str, text))
1 2 3 4 5
Вместе будем мы считать
5 4 3 2 1
Мы считать научим вас
Думаю, достаточно наглядно 🤓
#libs#regex
#Italia
La Presidente del Consiglio, Giorgia #Meloni (#Fd|ECR) in un’informativa urgente sull’azione del governo:
“Non sono solita ingerire nel lavoro delle commissioni parlamentari d’inchiesta, ma mi permetto di chiedere alla commissione parlamentare antimafia di occuparsi dei tentativi di infiltrazione della criminalità organizzata nei partiti politici, Fratelli d’Italia compreso. Mentre alcuni usano il tema per fare propaganda contro gli avversari, a me interessa costruire gli anticorpi a un fenomeno che ci riguarda tutti. Non accetto che i miei sacrifici possano essere usati per gli interessi di quelli che combatto dal 19 luglio del 1992, e non accetto lezioni su questo tema”.
@OsservatorioItaliano
#Romania🇷🇴
#Presidenziali
Nicușor #Dan, 55 anni, è originario di Făgăraș (Transilvania). È Sindaco di Bucarest dal 2020. In precedenza è stato anche deputato per la Capitale dal 2016 al 2020. Fu tra i fondatori del partito Unione Salvate la Romania (#USR|RE), di cui è stato anche Presidente tra il 2016 e il 2017; ha fondato il partito come continuazione del progetto "Unione Salvate Bucarest". È uscito dal partito il 1° giugno 2017 ed è quindi rimasto un indipendente. Dan è sostenuto dall'USR, da Forza della Destra (#FD|PPE), dal Partito #DREPT|Centro anticorruzione, dal Partito del Movimento Popolare (#PMP|PPE), da Rinnoviamo il Progetto Europeo della Romania (#REPER|RE) e da altri partiti minori.
@TuttoElezioni