Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
የዳግማዊ አፄ ምኒልክ የታላቁ ቤተመንግሥት የጥበቃ ቤቶች በዘመናቸው ፤ ፬ ኪሎ - አዲስ አበባ
Guardhouses Of The Grand Palace of Emperor Menelik II, 4 Kilo - Addis Ababa;
#ታሪክን_ወደኋላ#TariknWedehuala#addisababa
youtube.com/@tariknwedehuala11
ፕሬዝዳንት መንግስቱ ኃይለማርያም ከአሜሪካ ለአፍሪካ ቡድን ጋር በኢትዮጵያ ስለተከሰተው ረሃብ እና በሰብአዊ እርዳታ ትብብር ላይ ለመወያየት በፅህፈት ቤታቸው ጋብዘው በሚወያዩበት ወቅት ፤ 1977 ዓ.ም (አዲስ አበባ)
Ethiopian President Mengistu Haile Mariam meets with the 'USA for Africa' team in his office, 1985, as part of discussions on humanitarian aid and collaboration amidst the Ethiopian famine crisi.
#ታሪክን_ወደኋላ#TariknWedehuala#addisababa
youtube.com/@tariknwedehuala11