Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
Oak and Ivy — Holler (Self-Released, 2024)
#traditional#field_recording#appalachian#oldtime#clawhammer#banjo#United_States
Holler — сольная акустическая запись, сделанная ночью в Аппалачах. В альбом вошли традиционные песни региона, исполненные без студийной обработки, в живой и непосредственной манере. Среди них, например, — The Cuckoo, английская народная песня, получившая широкое распространение в Северной Америке, и Cluck Old Hen, один из старейших образцов аппалачского репертуара, впервые записанный в 1923 году Фиддлином Джоном Карсоном, но известный в устной традиции как минимум с 1886 года.
🔗Bandcamp | Telegram
Jerron Paxton — Things Done Changed (Folkways Records, 2024)
#blues#oldtime#ragtime#cajun#guitar#banjo#harmonica#United_States
Джеррон Пакстон — мультиинструменталист из Лос-Анджелеса, выросший в семье выходцев из Луизианы. Он исполняет блюз, рэгтайм, олдтайм и каджунскую музыку — локальную традицию Луизианы, возникшую среди франкоязычного населения и вобравшую в себя элементы французского фольклора, креольной культуры и ритмики африканской диаспоры.
Семья Пакстона перебралась в Калифорнию после убийства Эмметта Тилла — четырнадцатилетнего подростка, линчёванного в Миссисипи в 1955 году после обвинения со стороны белой женщины. Убийство Эмметта Тилла получило широкую огласку и стало поворотным моментом в истории борьбы за гражданские права чернокожих в США. Многие афроамериканцы после этого предпочли уехать с Юга, и Южный Лос-Анджелес, куда попали родственники Пакстона, стал одним из новых центров их жизни — не чужим, а скорее пересобранным Луизианским югом на новом месте.
Things Done Changed — первый альбом Джеррона Пакстона, целиком состоящий из авторских песен. При этом, как и предыдущие работы музыканта, он выдержан в стилистике традиционной афроамериканской музыки первой половины XX века. Музыкальные интересы Пакстона начали формироваться ещё в детстве — он подолгу слушал радио, стараясь уловить манеру исполнения, структуру старинных песен и их скрытые смыслы. Со временем он освоил гитару, банджо, фортепиано, скрипку и другие инструменты, звучащие в афроамериканской музыкальной традиции.
На альбоме Things Done Changed Пакстон создаёт авторские композиции, в которых стилистика прошлого становится языком разговора о настоящем. Например, в песне So Much Weed он с иронией и горечью поёт о том, как чернокожие американцы до сих пор отбывают сроки за незначительные правонарушения, связанные с марихуаной, — в то время как в большинстве штатов её продажа уже давно легализована.
🔗Spotify | AppleMusic | YouTube | Bandcamp | Telegram