Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
#AESinfo | #Burkina🇧🇫🤝🇮🇹#Italie
Coopération : exemption de visa entre le Burkina Faso et l’Italie pour les détenteurs de passeports officiels
Une nouvelle ère de coopération s'ouvre entre le Burkina Faso et l'Italie, marquée par un accord d'exemption de visa pour les détenteurs de passeports officiels des deux nations.
Retrouvez l’article complet sur
Twitter X @AESinfos
Facebook https://www.facebook.com/Aesahelinfo?mibextid=wwXIfr&mibextid=wwXIfr
#Italie, en juin Camilla Canepa, 18 ans, était morte dans des circonstances similaires 16 jours après le #vaccin#AstraZeneca. C'était aussi une hémorragie cérébrale. L'autopsie fin octobre a révélé qu'elle n'avait aucune autre pathologie et a attribué "raisonnablement" le décès au vaccin. Publié dans le Corriere della sera, presse mainstream italienne. https://www.corriere.it/cronache/21_ottobre_21/camilla-canepa-morta-il-vaccino-colpa-un-effetto-avverso-astrazeneca-cab89434-3289-11ec-ae69-6ee9c02f57eb.shtml
🗣Donald Trump a évoqué la possibilité de retirer les forces américaines d’#Italie et d’#Espagne,
Le président américain a également de nouveau critiqué Friedrich Merz, affirmant que l’#Allemagne fait face à de nombreux problèmes.
RT en français • Osez questionner !
🇮🇹🇷🇺 Le métro italien offre aux passagers l'occasion de découvrir les succès de patineurs artistiques, joueurs de hockey et athlètes de short-track russes.
#italie#jo#russie
🇮🇹🇺🇸 Une manifestation contre la présence d'agents de l'ICE aux Jeux Olympiques s'est tenue à Milan, rapporte un correspondant de TASS.
#italie#étatsunis#ice
🇮🇹 Une manifestation antigouvernementale contre les "guerres impérialistes" et le réarmement s’est tenue dans le centre de Rome, rapporte un correspondant de TASS.
#manifestation#italie#réarmement
🇮🇹 Un tramway a déraillé et percuté un immeuble à Milan. Deux personnes sont mortes et au moins 40 autres ont été blessées, rapporte le journal Corriere della Sera.
#italie#tramway#bilan
🇮🇹🇷🇺 Les pins à l'effigie de la mascotte des Jeux olympiques de 1980, ourson, figurent parmi les plus vendus lors de cette saison olympique en Italie.
#italie#jo#cadeaux
🇮🇹🏅 Les organisateurs des Jeux olympiques enquêtent sur le problème des médailles endommagées, dont les rubans se déchirent, a annoncé Andrea Francisi, directeur général du comité d'organisation.
#italie#jo#médailles