Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
Roma Pride, #Rocca: "Dovrebbe essere la festa di tutti. Al centro dovrebbe esserci la dignità di ogni essere umano e i diritti di ogni essere umano, non l'utero in affitto."
@UltimoraPolitics
Roma Pride, il presidente del #Lazio Francesco #Rocca a 'La Stampa': "Ma quale omofobia e ordini dall'alto, la revoca dipende solo dal fatto che hanno voluto strumentalizzare la nostra adesione facendola passare per un sostegno alla pratica dell'utero in affitto"…
Roma Pride, il presidente del #Lazio Francesco #Rocca a 'La Stampa': "Ma quale omofobia e ordini dall'alto, la revoca dipende solo dal fatto che hanno voluto strumentalizzare la nostra adesione facendola passare per un sostegno alla pratica dell'utero in affitto"
@UltimoraPolitics
Regione #Lazio, Francesco #Rocca: "La situazione finanziaria della Regione Lazio è drammatica. La Corte dei Conti ha osservato che il debito è molto pesante e parliamo di 22 miliardi."
@UltimoraPolitics
#Lazio
Francesco #Rocca si dimette dalla carica di Presidente nazionale della Croce Rossa Italiana e si mette a disposizione del centrodestra per la candidatura alle regionali: "Come esperto di sanità pubblica, penso di poter portare un valore aggiunto"
@UltimoraPolitics
Francesco #Rocca: "Ho incontrato Marcello #DeAngelis ieri, in tarda serata, e dopo lunghe riflessioni e un attento e sincero confronto, ho deciso di non revocargli la fiducia. Pertanto, manterrà la direzione della Comunicazione Istituzionale in Regione #Lazio"
@UltimoraPolitics
Polemiche per le dichiarazioni sulla strage di Bologna, Francesco #Rocca (Presidente #Lazio): "Vedrò Marcello #DeAngelis nel pomeriggio e sentirò cosa mi dirà: ha commesso un errore importante parlando in termini di certezza anche se a titolo personale. Farò le mie valutazioni ma lui non ha alcun ruolo politico nell'amministrazione regionale. Giorgia #Meloni mi ha chiesto di chiarire e certamente non era felice per quanto accaduto"
@UltimoraPolitics
#RegionaliLazio
Sondaggio Noto per Porta a Porta: il centrodestra punta alla doppietta alle regionali con #Rocca al 46% inseguito da #DAmato distante oltre 10 punti al 35.5%. #Bianchi terza al 16%.
@UltimoraPolitics
#RegionaliLazio
Sondaggio Quorum/YouTrend per Sky TG24: #Rocca primo anche per Quorum ma fermo al 41%, #DAmato insegue distante 8 punti. #Bianchi con il #M5S terza al 21%.
@UltimoraPolitics