Функция sub в regex может принимать функцию в качестве аргумента repl.
📄 Из документации:
If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string.
То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений.
Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений.
Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере:
Создаем карту замены. То есть какие строки на какие требуется менять.
remap = {
'раз': '1',
'два': '2',
'три': '3',
'четыре': '4',
'пять': '5',
}
Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match.
Используя данные этого объекта мы вычисляем замену on-the-fly!
def get_str(match: re.Match):
word = match.group(1)
return remap.get(word.lower()) or word
Пример текста.
text = '''Раз Два Три Четыре Пять
Вместе будем мы считать
Пять Четыре Три Два Раз
Мы считать научим вас
'''
Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции.
(Данный паттерн ищет отдельные слова в тексте)
>>> print(re.sub(r'(\w+)', get_str, text))
1 2 3 4 5
Вместе будем мы считать
5 4 3 2 1
Мы считать научим вас
Думаю, достаточно наглядно 🤓
#libs#regex
- Covid NOT 1 held accountable
- Crossfire hurricane NOT 1 held accountable.
- Epstein NOT 1 held accountable
- Jan 6th hoax NOT 1 held accountable
- Stolen Election NOT 1 held accountable
Sucking off israel is all that seems to matter to Trump & #MAGA
These doorknockers/phone-bankers come all the way from SoCal, rent an AirBnB for WEEKS, and just GO FOR IT! True Americans who love their country! #MAGA @realDonaldTrump @KariLake
Let’s be honest, are there any Americans that are going to be sad to see the IRS gone? #MAGA
"The Fair Tax would repeal the current tax code and replace it with a single national consumption tax," a statement from Carter's team reads. "In addition to eliminating all personal and corporate income taxes, the death tax, gift taxes, and the payroll tax, the Fair Tax would also eliminate the need for the Internal Revenue Service."
https://www.newsweek.com/republican-plan-abolish-federal-income-taxes-irs-reform-2023362
Самолет с пулом журналистов Джо Байдена не смог вылететь в Европу из-за … цикад
Борт с прессой уже стоял на взлетной полосе. Но оказалось, что есть незарегистрированные пассажиры - насекомые🦟 Они заползли в двигатели, рейс пришлось отложить с 9 вечера до 2 утра. Репортеров отправили в отель, привезли пиццу, открыли бар (так что грустно им не было) и пообещали, что новый самолет скоро прилетит из Нью-Йорка в Вашингтон. Говорят, Байдену (он вылетает сегодня) такие проблемы не страшны, у него самолет понадежнее и способен выдерживать и не такое.
🤡В соцсетях стали шутить, что fakenews не пускают в Европу, и это #MAGA (или вернее сам Трамп) натравил вредителей на команду Байдена.
🐛Шутки шутками, а в реальности этой новости не удивились. Последние недели миллиарды цикад облетели восток США. Это выводок под цифрой X, так называемых, периодических цикад. У них уникальный жизненный цикл: большую часть жизни проводят под землей, поднимаясь на поверхность раз в 13 или 17 лет. Насекомые находят пару, размножаются, откладывают яйца и погибают. Потом на свет появляются личинки, которые прячутся под землю и ждут своего часа Х, чтобы организовать нашествие. 17 лет прошло. И теперь жители страдают от этих больших, громких и назойливых насекомых, которые заполняют собой всё пространство и мешают жить