Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
Durante il soggiorno in Albania la premier #Meloni è venuta a conoscenza dal premier albanese #Rama che alcuni turisti italiani sarebbero fuggiti senza pagare dopo un cena in un ristorante di Berat. L’ambasciata d’Italia a Tirana ha diramato un comunicato…
Durante il soggiorno in Albania la premier #Meloni è venuta a conoscenza dal premier albanese #Rama che alcuni turisti italiani sarebbero fuggiti senza pagare dopo un cena in un ristorante di Berat. L’ambasciata d’Italia a Tirana ha diramato un comunicato rendendo noto di aver provveduto a saldare il conto, di circa 80 euro, su indicazioni della Presidente del Consiglio.
@UltimoraPolitics
Sky: Il premier albanese #Rama rivela che, grazie l'aiuto dei servizi segreti, l'Italia e il ministro #DiMaio hanno contrabbandato in Albania dei vaccini, per ovviare alle stringenti regole di Pfizer.
@UltimoraPolitics
Albania, attimi di tensione all'uscita della conferenza stampa congiunta tra Giorgia #Meloni ed Edi #Rama. Riccardo #Magi si è presentato fisicamente per criticare gli accordi confermati tra i due Paesi sulla gestione dei migranti. Il deputato di +Europa, contestando l'"hotspot elettorale", è stato subito bloccato dalla sicurezza albanese. Meloni è scesa dall'auto chiedendo di lasciarlo spiegando che "è un parlamentare italiano". Ma poi tra i due c'è stato un battibecco: "Pensi cosa può succedere senza telecamere qui dentro! Si vergogni!". E la premier: "La capisco. Ho fatto un sacco di campagne elettorali in cui non sapevo se avrei superato la soglia"
@UltimoraPolitics
#Italia#Albania
La Presidente del Consiglio, Giorgia #Meloni (#FdI|ECR), ha ricevuto oggi a Palazzo Chigi il Primo Ministro della Repubblica d’Albania, Edi #Rama (#PSSh|S&D).
“A cinque mesi dal Vertice Intergovernativo di Roma, il colloquio ha permesso di fare il punto sul rafforzamento del partenariato tra le due Nazioni nei settori di interesse comune, con un focus particolare su connettività, industria della difesa e collaborazione in materia migratoria”, si legge in una nota.
@OsservatorioItaliano