Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
#Jpop
About a month ago we announced that we're looking to expand our moderation team. A big thank you to everyone who responded and offered their services!
The search is now over! Please welcome our three new victims moderators that will keep this place in order, so that everyone can easily find the torrents they need and marvel at how pretty everything is. And these people are:
Y***
A***
S*******
xvlse0l.jpg
Yaaaaay!
雞泡泡
大約一個月前,我們宣布我們正在尋求擴大我們的審核團隊。 非常感謝所有回复並提供服務的人!
搜索結束了! 請歡迎我們的三位新受害者主持人,他們將把這個地方整理好,這樣每個人都可以輕鬆找到他們需要的種子,並驚嘆於一切都很美。 這些人是:
Y ***
一個***
小號*******
xvlse0l.jpg
Yaaaaay!
名称:URU THE BEST 2020 - 2024 FLAC 16bit 44kHz
描述:《URU THE BEST 2020–2024》是日本歌手URU官方数字精选辑,收录2020–2024年代表作22首。她以空灵嗓音、诗意编曲和极低曝光度闻名,音乐以钢琴为骨架,融合环境音效,风格温柔治愈。专辑不只是商业精选,更是封存情感的时间胶囊,2023年与Ayase合作的《Saikai》助其破圈,被乐评称作“2020年代最安静的杰作合集”。
链接:https://pan.quark.cn/s/8404dc7b0485
📁 大小:649MB
🏷 标签:#无损音乐#音乐#jpop