Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
- Covid NOT 1 held accountable
- Crossfire hurricane NOT 1 held accountable.
- Epstein NOT 1 held accountable
- Jan 6th hoax NOT 1 held accountable
- Stolen Election NOT 1 held accountable
Sucking off israel is all that seems to matter to Trump & #MAGA
These doorknockers/phone-bankers come all the way from SoCal, rent an AirBnB for WEEKS, and just GO FOR IT! True Americans who love their country! #MAGA @realDonaldTrump @KariLake
Let’s be honest, are there any Americans that are going to be sad to see the IRS gone? #MAGA
"The Fair Tax would repeal the current tax code and replace it with a single national consumption tax," a statement from Carter's team reads. "In addition to eliminating all personal and corporate income taxes, the death tax, gift taxes, and the payroll tax, the Fair Tax would also eliminate the need for the Internal Revenue Service."
https://www.newsweek.com/republican-plan-abolish-federal-income-taxes-irs-reform-2023362
Самолет с пулом журналистов Джо Байдена не смог вылететь в Европу из-за … цикад
Борт с прессой уже стоял на взлетной полосе. Но оказалось, что есть незарегистрированные пассажиры - насекомые🦟 Они заползли в двигатели, рейс пришлось отложить с 9 вечера до 2 утра. Репортеров отправили в отель, привезли пиццу, открыли бар (так что грустно им не было) и пообещали, что новый самолет скоро прилетит из Нью-Йорка в Вашингтон. Говорят, Байдену (он вылетает сегодня) такие проблемы не страшны, у него самолет понадежнее и способен выдерживать и не такое.
🤡В соцсетях стали шутить, что fakenews не пускают в Европу, и это #MAGA (или вернее сам Трамп) натравил вредителей на команду Байдена.
🐛Шутки шутками, а в реальности этой новости не удивились. Последние недели миллиарды цикад облетели восток США. Это выводок под цифрой X, так называемых, периодических цикад. У них уникальный жизненный цикл: большую часть жизни проводят под землей, поднимаясь на поверхность раз в 13 или 17 лет. Насекомые находят пару, размножаются, откладывают яйца и погибают. Потом на свет появляются личинки, которые прячутся под землю и ждут своего часа Х, чтобы организовать нашествие. 17 лет прошло. И теперь жители страдают от этих больших, громких и назойливых насекомых, которые заполняют собой всё пространство и мешают жить