Функция sub в regex может принимать функцию в качестве аргумента repl.
📄 Из документации:
If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string.
То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений.
Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений.
Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере:
Создаем карту замены. То есть какие строки на какие требуется менять.
remap = {
'раз': '1',
'два': '2',
'три': '3',
'четыре': '4',
'пять': '5',
}
Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match.
Используя данные этого объекта мы вычисляем замену on-the-fly!
def get_str(match: re.Match):
word = match.group(1)
return remap.get(word.lower()) or word
Пример текста.
text = '''Раз Два Три Четыре Пять
Вместе будем мы считать
Пять Четыре Три Два Раз
Мы считать научим вас
'''
Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции.
(Данный паттерн ищет отдельные слова в тексте)
>>> print(re.sub(r'(\w+)', get_str, text))
1 2 3 4 5
Вместе будем мы считать
5 4 3 2 1
Мы считать научим вас
Думаю, достаточно наглядно 🤓
#libs#regex
Hobbs ripped as 'total disgrace' after vetoing bill limiting Chinese land ownership near military bases https://www.foxnews.com/politics/dem-governor-ripped-total-disgrace-after-vetoing-bill-limiting-chinese-land-ownership-near-military-bases#FoxNews
At least one dead after jet crashes into another plane at Scottsdale Airport in Arizona https://www.foxnews.com/us/least-one-dead-after-jet-crashes-another-plane-scottsdale-airport-arizona#FoxNews
🔻 Biden accused of ‘moving goalposts’ on percentage of Americans who need to get jab to return normal https://t.co/LzJxFI3CdG#FoxNews
September 29, 2021 at 04:45PM
via Twitter
@SenTedCruz
🔻 Border Patrol agents see 3,166% increase in convicted sex offender arrests in Del Rio Sector https://t.co/9X50ziXFYK#FoxNews
June 25, 2021 at 12:30AM
via Twitter
@SenTedCruz
#newtgingrich : RT @MariaBartiromo: Rep. Kevin McCarthy on debt ceiling talks: 'I will never give up' https://t.co/BRZg1fPCs7#FoxNews@SundayFutures@FoxBusiness
#newtgingrich : RT @MariaBartiromo: Trafalgar Group pollster Robert Cahaly predicts 'strong night' for Republicans https://t.co/Zttn6XkTOA#FoxNews@SundayFutures@FoxNews
#newtgingrich : RT @MariaBartiromo: Herschel Walker rips Warnock's lack of business experience: 'He never built anything' https://t.co/uprZBwsrTK#FoxNews@SundayFutures@FoxNews
#newtgingrich : RT @MariaBartiromo: Rep. Kevin McCarthy cites 'cost of living' as top priority for voters ahead of midterms https://t.co/0gukhkMjkr#FoxNews@SundayFutures@FoxNews
¿Lo de #RochaMoya es político? 🤔
🔴 La zar antidrogas de #EU reconoció en #FoxNews las acciones del gobierno de #Sheinbaum para combatir el narcotráfico 📺🇲🇽👏🏻
https://sinlineamx.com/eu-reconoce-eficiencia-gobierno-sheinbaum-combate-narco/