Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
Fratelli d'Italia presenta la proposta di legge che chiede di istituire il 17 marzo come festa nazionale dell'unità d'Italia. Giovanni #Donzelli: "Speriamo che il 17 marzo 2024 si possa già festeggiare"
@UltimoraPolitics
Giovanni #Donzelli (#FdI): "Le scuse? No. Andrò volentieri al giuri’ d’onore per chiedere al Pd di chiarire le sue parole. Mi auguro che la sinistra italiana che sta balbettando su Cospito chieda scusa agli italiani"
@UltimoraPolitics
❗️ Caso #Donzelli, la Procura di Roma apre un fascicolo di indagine. Si ipotizza reato di rivelazione e utilizzazione di segreto d'ufficio, per aver "reso pubbliche intercettazioni ambientali del Dap tra esponenti della 'ndrangheta e della camorra con Alfredo #Cospito"
@UltimoraPolitics
#Italia
Il deputato di #FdI|ECR Giovanni #Donzelli attacca l'eurodeputata Ilaria #Salis (ind. area #AVS|LEFT|G/EFA):
“Da ore grida al pericolo per la Democrazia per un banale controllo di polizia. Ma chi c’era con lei nella camera d’albergo? Leggo da Il Giornale che nella camera d’albergo era in compagnia di Ivan Bonnin, suo assistente al Parlamento Europeo, che è un pregiudicato arrestato e condannato nel 2015 per violenza privata e interruzioni di pubblico servizio aggravato. Ora, la sinistra si ritiene così una casta da ritenere intoccabili pure pregiudicati se condividono la camera d’albergo con qualcuno di loro? Io nel dubbio sto depositando un’interrogazione parlamentare per sapere tutti i precedenti di questo accompagnatore di Ilaria Salis pagato con i soldi pubblici”.
@Osservatorioitaliano
Caso #Donzelli, Debora #Serracchiani: "Dispiace che il presidente #Meloni faccia finta di niente perché i fatti sono gravi e se non sente il bisogno di intervenire siamo costretti a pensare che abbia tollerato o addirittura approvato quanto avvenuto"
@UltimoraPolitics
Caso #Donzelli, il presidente della Camera Lorenzo #Fontana accoglie la richiesta del #PD e istituisce il Giurì d'onore per fare chiarezza su quanto detto dal deputato di #FdI
@UltimoraPolitics
Debora #Serracchiani (#PD): "Parole di #Donzelli gravissime, hanno contenuto e carattere di rilevanza penale. Visto che Donzelli ha importanti ruoli istituzionali, chiediamo alla presidente Meloni se la pensa allo stesso modo"
@UltimoraPolitics
Caso #Donzelli, Carlo #Nordio sul documento citato alla #Camera dal deputato #FdI: "La natura del documento non rileva e disvela contenuti sottoposti al segreto investigativo o rientranti nella disciplina degli atti classificati"
@UltimoraPolitics