Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
#piano
#Richter
#Kagan
#Estonia
Рихтер и рояль «Estonia»
«В 1945 году состоялся Всесоюзный конкурс музыкантов-исполнителей. На первом туре выступление Рихтера в Малом зале консерватории было необычным. По каким-то обстоятельствам Слава опоздал более чем на час (все мы толпились на «пятачке» перед закрытой дверью). Наконец, Рихтер в темпе presto влетел на сцену, публика расселась, и он заиграл. После Баха – прелюдии и фуги cis-moll из первого тома, если я не ошибаюсь, – он грандиозно начал «Дикую охоту» Листа. Вдруг погас свет. Слава продолжал играть, как ни в чём не бывало. Кто-то поставил на рояль зажжённую свечу, а она, не выдержав накала страстей, рухнула. Тем не менее, Рихтер блистательно завершил выступление».
Из книги Льва НАУМОВА «Под знаком Нейгауза. Беседы с Екатериной Замоториной»:
Мне кажется, я знаю, почему Рихтер тогда опоздал. Много лет спустя мой друг и коллега композитор Ваня Соколов рассказывал, что была у Рихтера такая манера: перед концертом ходить на далёкие расстояния пешком чуть ли не вокруг всей Москвы. Не знаю, правильно ли я помню его слова. Не знаю также, откуда сам он узнал об этом. Возможно от своего учителя - профессора Московской консерватории Льва Николаевича Наумова. Однако в результате, картинка (или пазл) однажды увиденного в детстве, у меня сложилась.
А дело было так: в музыкальную школу, где училась моя сестра Тина, приехали «обыгрываться» Святослав Рихтер и Олег Каган. По этому случаю в школе была проведена генеральная уборка. Всего лишнего. Лишним оказался рояль «Estonia», многие месяцы, если не годы, лежавший навзничь в коридоре. Из него с немым укором торчали бесхозные молоточки и клавиши. Рояль вынесли на задний двор.
Приехал Рихтер. А дальше концерт никак не начинался. Мы, дети, начали бегать вокруг школы.
И тут предстала перед нами картина: на заднем дворе стоят у опрокинутой «Эстонии» Рихтер и Нина Львовна Дорлиак. Рядом с ним она казалась маленькой, как птичка. Она ему что-то тихо говорит. Он непреклонно молчит и мычит в ответ.
Как теперь кажется, он тогда не хотел играть. Она уговорила.
Эта привычка ходить перед концертом - не только вокруг всей Москвы, из-за чего он, собственно, и опоздал, как я полагаю, тогда на конкурс - была всегда.
(И его, тем не менее, больше часа прождали и зрители, и жюри, что теперь и представить невозможно!)
Вот так, прогуливаясь вокруг школы он несчастную «Эстонию» на заднем дворе и обнаружил.
Но концерт потом сыграл. Тоже на «Эстонии». Других инструментов в школах тогда почти не было.
Впечатление было очень яркое. Играли они с Каганом Сонаты Моцарта, а Сам - Гайдна.
У Кагана вокруг губ была синяя кайма. Мама сказала (она была врач), что у него цианоз, что говорило о болезни сердца. Играл он бесподобно.
Но особенно интересно было видеть как постоянно менялся Звук у Рихтера - нет, не от прикосновений рук даже, а от движений его корпуса.
Он сидел высоко. Крупная голова. Мощная фигура. Какой-то демонизм в нем, безусловно, присутствовал. Недаром Листа играл в кино.
Но самое сильное впечатление было от пауз.
Они были осязаемы.
Они подчиняли.
Это завораживало.
От того вечера (или дня) у меня осталось фото:
не то обескураженный, не то растерянный Рихтер у окна Школы.
А в окне - неприглядный городской пейзаж в виде трубы известной в районе американской химчистки.
#music
#Richter
#Artur Rubinstein
#musucschool
О ГЕНИЯХ И ТАЛАНТАХ
«Ну а этот мальчик… его называют - волжский Рихтер» - сказал папа. Не мой. Этот был папа одной девочки, сдававшей зачет в моей Музыкальной школе. (ДМШ Училища при Московской консерватории, в более узких кругах - просто Мерзляковка, по названию переулка, в котором уже более 130 лет эта Школа находится). Сестра девочки, сдававшей зачет, и вторая дочь этого замечательного папы, училась в ЦМШ. Он страшно гордился, естественно.
Кто бы этим не гордился тогда! Артоболевская, Кестнер, Сумбатян, Ховен, Тимакин… и им несть числа. Правда, тогда они уже были, по большей части, очень пожилые.
Родители наши, в смысле, детей, сдававших зачет, как всегда, сидели или стояли в коридоре и говорили о своих высокогениальных детях. Они искренне верили в большинстве своём в их гениальность. Почти все. Кроме моих. Папа даже не знал, где моя музыкальная школа находится. Мама с интересом слушала. А после очередного урока или зачета/экзамена, пересказывала.
- Рассказ номер раз звучал чаще всего, и назывался он «Наш(а) пошёл(пошла) по стопам Великого… папы/мамы/дядюшки/дедушки…».
- Рассказ номер два звучал: «… Он уже в три с половиной месяца пел и практически играл… Третий концерт Рахманинова».
- Рассказ номер три: «… Я даже нот не знаю, а он уже Симфонию сочинил».
- Рассказ номер четыре: «… А такой-то (как правило, это был некто не меньше, чем Рихтер/Ростропович/Ойстрах ) сказал, что он Гений»…
- Пять: «… Он сыграл свой первый сольный Концерт в Большом зале консерватории… в четыре года»…
- дальше: «… Его (ее) приняли ОДНУ в ЦМШ в третий класс. Было 10000 заявлений».
- И, вконец, последнее, на чем моя мама окончательно сломалась: «… Его называют «волжский Рихтер» (ребёнок был родом, кажется, из Самары). Но ведь Рихтер может быть только один!!! Он, кстати, родом был из Одессы. А родился в Житомире.
В этом рилсе Великий Артур Рубинштейн говорит как раз об этом:)
Доброго вечера, друзья!
Ваша PiaNinoNotovna
My telegram: https://t.me/ninonotovna
Артур Рубинштейн о сравнениях в искусстве пианизма:
https://www.instagram.com/reel/DITdp5VAJdF/?igsh=MXYxaDZhZm1mdm52Mw==
На фото:
Святослав Рихтер
Артур Рубинштейн
ДМШ Училиша при Московской консерватории
‼️Der französische Richter Nicolas Gouyou, der beim IStGH einen Haftbefehl gegen Netanjahu erlassen hat...‼️
• Visa und Mastercard haben alle meine Karten gesperrt
• Ich kann keine Einkäufe tätigen
• Ich bin Richter, werde aber wie ein Krimineller behandelt
• Richter, Anwälte und Politiker werden eingeschüchtert
• Ein Kollege sagte mir, mein Name werde erst nach Ablauf von Trumps Amtszeit von der schwarzen Liste gestrichen
• Trotz der Intervention des französischen Präsidenten haben die US-Behörden nicht reagiert
Quelle: Ramy Abdul
#Zensur#Justiz#Richter#SchwarzeListe#Netanjahu#Haftbefehl#Frankreich#Kartensperre
TEILEN
Folgt mir auf Telegram
↕️↕️↕️
https://t.me/Kampf_fuer_unsere_Zukunft
Chat-Kanal
⬇️⬇️⬇️
https://t.me/IavYc2SRFdY1OGY6