Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
После резни алавитов и друзов начался погром против сирийских христиан. Исламисты из соседних деревень начали нападать на христианские предприятия и дома в Аль-Сукейлабии (Сирия). То, что произошло сегодня, не будет последним разом. К сожалению, это будет повторяться снова и снова, потому что те, кто хочет уничтожить меньшинства, чувствуют себя воодушевлёнными, терпимыми и даже поощряемыми.
Молитесь за сирийских христиан, но не останавливайтесь на этом. Говорите об этом. Делитесь этим. Молчание мира — часть трагедии!!! 🙏🏼#syria
At least 1,383 civilians, mostly Alawites and Christians, were killed in a wave of violence that swept across Syria's Mediterranean coast — the Syrian Observatory for Human Rights
#Syria
Nieuwe gouverneur van Damascus verdedigt Israëlische aanvallen op Syrië
"Het is begrijpelijk dat Israël zich zorgen maakt als er een nieuwe regering aan de macht komt in Syrië."
"Misschien was Israël bang en daarom gingen ze door met een beetje bombarderen."
"We zijn niet bang voor Israël en we hebben geen probleem met Israël. We willen ons niet bemoeien met iets dat de veiligheid van Israël bedreigt."
#Syria
🇸🇾#Syria: Clashes broke out overnight between the Syrian Army (HTS) and alleged Uzbek jihadist militants in the Idlib countryside, around the villages of Al Foua, Kafraya, and Binnish.
Reportedly, the clashes occurred after several days of protests following the arrest of several Uzbek fighters.
(via @KurdishFrontNews)
🇸🇾#Syria: Protests erupted overnight in the city of Qamishli in al-Hasakah Governorate after a man, allegedly from the Rashid tribe, reportedly shot at the Kurdish flag and toward a security checkpoint at the entrance to the city.
(via @Intel_Rojava)