Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
Various Artists — Crowing at Night: Macedonian Traditional Dances & Songs from Radio Skopje ca. 1949-50 (Canary Records, 2024)
#traditional#balkan#bulgarian#macedonian#zurla#tapani#North_Macedonia
Этот альбом посвящен македонской традиционной музыке, записанной для Радио Скопье в 1949–1950 годах. В сборнике представлены композиции в стиле македонской городской песни «чалгия» (чалгија), а также записи флейты зурлы и барабана тапани — традиционных инструментов, генетически связанных с османскими зурной и давулом. Записи были сделаны в Скопье, а затем изданы в США благодаря усилиям македонского эмигранта Спирри Бога, основателя лейбла Sperry.
Спирри Бог, урожденный Спиро Богойевич, эмигрировал в США в 1923 году, а в 1950 году во время поездки на родину получил доступ к архиву Радио Скопье. Вернувшись в Детройт, он обработал записи и выпустил их на собственном лейбле Sperry. Записи стали очень популярны среди македонской диаспоры Детроита.
Помимо Спирри Бога, в середине прошлого века изданием македонской музыки занимался нью-йоркский лейбл Newtone. Примерно в то же время, что и Бог, лейбл выпустил несколько записей, сделанных на той же радиостанции в Скопье.
В итоге, в этом сборнике представлено 15 восстановленных композиций, среди которых преимущественно те, которые Спирри Бог вывез из Македонии, а также два трека (14-ый и 15-ый), выпущенных лейблом Newtone. Эти записи дают уникальную возможность взглянуть на музыкальное наследие Македонии в том виде, в котором оно было представлено в середине XX века.
🔗Bandcamp
Various Artists — The Archival Recordings of Constantin Brăiloiu (Death Is Not The End, 2024)
#traditional#field_recording#basque#bretton#bulgarian#corsican#ethiopian#flemish#gaelic#georgian#greek#hausa#inuit#irish#italian#kabyle#macedonian#norwegian#romanian#russian#sardinian#sephardic#swiss#tuareg#Brittany#Flanders#Wallonia#Bosnia_and_Herzegovina#Bulgaria#China#England#Ethiopia#France#Georgia#Greece#India#Ireland#Italy#Japan#Macedonia#Norway#Portugal#Romania#Russia#Switzerland#Turkey
Сборник записей пионера румынской этномузыкологии, Константина Браилою. Треки с него впервые прозвучали на радио NTS в июле 2017 года, а в 2024 году лейблDeath Is Not The End выпустил его в формате полноценного альбома в честь своего 10-летия.
Сборник включает полевые записи народных песен и танцев и охватывает музыкальные традиции множества культур: английской, ирландской, гэльской, норвежской, бретонской, японской, итальянской, швейцарской, баскской, сардинской, эстонской, грузинской, греческой, турецкой, сефардской, португальской, французской, китайской, русской, хауса, туарегов, индийской, корсиканской, эфиопской, румынской, валлонской, фламандской, немецкой, кабильской, болгарской, македонской, боснийской и карибу-эскимосской.
Существенная проблема этого релиза заключается в том, что треки не проаннотированы. По этой причине слушателю придется упавать на свою собственную эрудицию и знание языков, чтобы понять, какая композиция принадлежит к какой культуре.
🔗Bandcamp | Telegram