Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
#Italia
La Presidente del Consiglio, Giorgia #Meloni (#Fd|ECR) in un’informativa urgente sull’azione del governo:
“Non sono solita ingerire nel lavoro delle commissioni parlamentari d’inchiesta, ma mi permetto di chiedere alla commissione parlamentare antimafia di occuparsi dei tentativi di infiltrazione della criminalità organizzata nei partiti politici, Fratelli d’Italia compreso. Mentre alcuni usano il tema per fare propaganda contro gli avversari, a me interessa costruire gli anticorpi a un fenomeno che ci riguarda tutti. Non accetto che i miei sacrifici possano essere usati per gli interessi di quelli che combatto dal 19 luglio del 1992, e non accetto lezioni su questo tema”.
@OsservatorioItaliano
#Romania🇷🇴
#Presidenziali
Nicușor #Dan, 55 anni, è originario di Făgăraș (Transilvania). È Sindaco di Bucarest dal 2020. In precedenza è stato anche deputato per la Capitale dal 2016 al 2020. Fu tra i fondatori del partito Unione Salvate la Romania (#USR|RE), di cui è stato anche Presidente tra il 2016 e il 2017; ha fondato il partito come continuazione del progetto "Unione Salvate Bucarest". È uscito dal partito il 1° giugno 2017 ed è quindi rimasto un indipendente. Dan è sostenuto dall'USR, da Forza della Destra (#FD|PPE), dal Partito #DREPT|Centro anticorruzione, dal Partito del Movimento Popolare (#PMP|PPE), da Rinnoviamo il Progetto Europeo della Romania (#REPER|RE) e da altri partiti minori.
@TuttoElezioni