Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
#Italia#Venezia
#Azione|RE Venezia nel direttivo Metropolitano di giovedì 26 marzo ha scelto di sostenere il candidato sindaco del cdx Simone #Venturini con il 95% dei voti favorevoli.
@OsservatorioItaliano
#Italia#Venezia#Comunali
Anche il #PLD|Liberali di Luigi #Marattin annuncia il sostegno al candidato sindaco del centrodestra Simone #Venturini.
La nota del partito sui social:
“A Venezia ci sono solo due candidature. Quella di centrosinistra e quella di centrodestra. Dopo settimane di interlocuzione, e avendo accettato, e inserito nel programma, le nostre priorità programmatiche, abbiamo deciso di sostenere Venturini”.
@Osservatorioitaliano
#Italia#Venezia#Comunali
Il Segretario di #Azione|RE Carlo #Calenda commenta su X il sostegno del suo partito al candidato del centrodestra Simone #Venturini (ind. di cdx) e il mancato accordo elettorale con #ORA|Liberisti:
“1) dovevamo fare un giro di incontri nazionali con ORA; 2) Boldrin ha deciso di candidarsi a Venezia senza dire nulla; 3) lo abbiamo appreso dai giornali insieme alla solita valangata di insulti ieri. 4) Azione non farà una lista alle elezioni a Venezia; 5) i due bravissimi under 30 che abbiamo lì hanno avuto totale libertà di scelta. Questo è. Dopodiché se si degnerà sentiremo Boldrin dopo che ci ha dato degli 'amici degli affaristi'. Ma questa non è politica, è una diretta YouTube.”
@Osservatorioitaliano
#Italia#Comunali#Veneto
Comunali di #Venezia, candidature ufficiali fin'ora:
📌 Simone #Venturini, sostenuto da #FdI, #Lega, #FI-#UdC, #PdV e #SVS (comprende #Azione e #CI)
📌 Andrea #Martella, sostenuto da #PD, #AVS, #VVP, #M5S, #TeA, #VèT, #VR (comprende #IV, #PiùE, #RI e #PSI) e #PRC
📌 Michele #Boldrin, sostenuto da #ORA
📌 Claudio #Vernier, sostenuto da #CV (comprende #Volt)
📌 Pierangelo #DelZotto, sostenuto da #PiV
📌 Giovanni Andrea #Martini, sostenuto da #TlCI, #LCcV e #VPL
@Osservatorioitaliano