Функция sub в regex может принимать функцию в качестве аргумента repl.
📄 Из документации:
If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string.
То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений.
Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений.
Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере:
Создаем карту замены. То есть какие строки на какие требуется менять.
remap = {
'раз': '1',
'два': '2',
'три': '3',
'четыре': '4',
'пять': '5',
}
Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match.
Используя данные этого объекта мы вычисляем замену on-the-fly!
def get_str(match: re.Match):
word = match.group(1)
return remap.get(word.lower()) or word
Пример текста.
text = '''Раз Два Три Четыре Пять
Вместе будем мы считать
Пять Четыре Три Два Раз
Мы считать научим вас
'''
Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции.
(Данный паттерн ищет отдельные слова в тексте)
>>> print(re.sub(r'(\w+)', get_str, text))
1 2 3 4 5
Вместе будем мы считать
5 4 3 2 1
Мы считать научим вас
Думаю, достаточно наглядно 🤓
#libs#regex
Jesse Derry was taken to hospital as a precaution following his first-half substitution during today’s #PL game against Nottingham Forest.
Jesse is conscious, talking and undergoing precautionary checks. We wish him a speedy recovery and thank the medical staff for their swift response.
Steve Holland:
“Our last game, Bournemouth to Leeds, is a #PL record, I think, in terms of time between games.
“So the gap has been as big as you can have really. I think we felt it was important to get the whole group together again, and really focus on finishing the season well.
“I think this is the PERFECT venue for that, really.”
Steve Holland:
“I think the language we should be using as this club is to finish as CLOSE as we possibly can to the top [this season].
“I don’t know how possible that is, but that has to be the challenge always: to get as close as we possibly CAN to the top...” [MU]
Bruno Fernandes on matching Cristiano Ronaldo’s #PL POTM record:
“It’s always good company. We know when records are there, his name will always be around.
“It’s a HUGE honour and privilege to be close to him.” 🇵🇹❤️
[THREAD]
There are multiple Premier League games on Saturday, Sunday AND Monday. 🍿
Here are some stats you might see in GW35...
#PL | @CopyBetUKhttps://t.co/RnveqOETlK
RT @Squawka: [THREAD]
There's five Premier League games on a Sunday for the first time in 2023. 🍿
Here are some stats you might see… 👀
#PL | @CopyBetUKhttps://t.co/sMqfA3FUuS