Функция sub в regex может принимать функцию в качестве аргумента repl.
📄 Из документации:
If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string.
То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений.
Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений.
Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере:
Создаем карту замены. То есть какие строки на какие требуется менять.
remap = {
'раз': '1',
'два': '2',
'три': '3',
'четыре': '4',
'пять': '5',
}
Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match.
Используя данные этого объекта мы вычисляем замену on-the-fly!
def get_str(match: re.Match):
word = match.group(1)
return remap.get(word.lower()) or word
Пример текста.
text = '''Раз Два Три Четыре Пять
Вместе будем мы считать
Пять Четыре Три Два Раз
Мы считать научим вас
'''
Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции.
(Данный паттерн ищет отдельные слова в тексте)
>>> print(re.sub(r'(\w+)', get_str, text))
1 2 3 4 5
Вместе будем мы считать
5 4 3 2 1
Мы считать научим вас
Думаю, достаточно наглядно 🤓
#libs#regex
La Commissione europea affida a Enrico #Letta l'incarico di redigere una relazione sul futuro del mercato unico. L'ex premier si occuperà di raccogliere i pareri di diversi organismi europei e nazionali, del mondo imprenditoriale e sindacale e delle associazioni della società civile
@UltimoraPolitics
Enrico #Letta: "Berlusconi ha fatto la storia del nostro Paese. La sua scomparsa segna uno di quei momenti in cui tutti, che siano stati vicini o lontani dalle sue scelte, si sentono coinvolti. Affetto e vicinanza ai suoi familiari e ai suoi amici. E a tutta la comunità politica di Forza Italia"
@UltimoraPolitics
#Italia
#Letta: Per fronteggiare l'emergenza immigrazione "dobbiamo uscire dai trattati europei, perché i trattati europei, su questo punto obbligano all'unanimità. Facciamo un accordo fra i Paesi, senza l'Ungheria. Insieme agli altri organizziamo una forma di accoglienza diffusa e i rapporti coi Paesi terzi"
@UltimoraPolitics
#Italia
#Letta: se vinciamo le elezioni aumenteremo stipendi insegnanti
Lo ha detto il segretario del Pd annunciando che giovedì sarà presentato il simbolo
@UltimoraPolitics
#Italia
Enrico #Letta: "Ho ascoltato Calenda. Mi pare da tutto quel che ha detto che l’unico alleato possibile per Calenda sia Calenda. Noi andiamo avanti nell’interesse dell’Italia."
@UltimoraPolitics
#Italia
Fratoianni e Bonelli hanno rifiutato l'offerta di #Letta di candidarli nelle liste del PD, garantendogli una elezione sicura.
@UltimoraPolitics