Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
💋🩰💌"Баядерка" — история любви воина Солора и танцовщицы Никии, разрушенная предательством и властью, но находящая завершение за пределами земной жизни
🔤🔤🔤🔤🔤🔤🔤🔤🔤🔤
🤩🤩побывала на балете
🤩🤩"Баядерка" в Кремлёвском дворце и осталась в полном восторге
У меня были высокие ожидания и они полностью оправдались
🔤💄🤩🩰🤩🤩🔤
Артисты танцевали технично и очень красиво, они передали всё чувства и эмоции героев, невозможно было отвести глаза от сцены
🔤#ballet🔤
🔤🩰🩰🤩🎀🎀🎀🔤
Спящая красавица
Сходила на балет и осталась в восторге!!
Всем известная исторн Шарля Перро оживает на сцене, появляется ощущение, что ты попадаешь в сказку
🩰Очень понравилась злая колдунья Карабос и хрупкая, нежная Аврора
🔤#ballet🔤
🔤🔤🔤🔤🔤🔤
🔤🔤🔤🔤🔤🔤🔤🔤🔤
🔤Ромео и Джульетта из враждующих семей влюбляются друг в друга и это превращается в трагедию🔤
🔤🩰🎀❤️📰🧷🔤
Эпоха балета продолжается и мы с Настей сходили на "Ромео и Джульетта"
🩰Сначала мне показалось мало хореографии и танцев, но к концу первого акта постановка начала нравится
🍂🍂🍂
Завораживали эмоции актеров и атмосфера средневековья Италии
Не пожалела, что успела купить билет за несколько дней до балета, дальше у нас в программе "Спящая красавица"
🔤#ballet🔤
Не влюбиться просто невозможно.....
🤩♥️🩰🎀💋🤩
Балет "Эсмеральда" по мотивам романа Виктора Гюго "Собор Парижской Богоматери" рассказывает о любви цыганки, предательстве и смерти
🤩🤩🤩🤩🤩🤩🤩🤩🤩🤩
🤩🤩🤩🤩
Балет, который покорил меня с первой минуты
Это было настолько прекрасно, что я смотрела, затаив дыхание
Герои буквально оживают на сцене Недавно читала книгу, а сейчас сама оказалась в истории и события разворачиваются на моих глазах
🌟🌟🌟
2,5 часа пролетели незаметно, под конец я немного расстроилась, что все закончилось, я была готова смотреть балет вечно
Декорации, музыка и атмосфера переносить тебя в прекрасный Париж 15 века, а эмоции и хореография актёров передают все чувства героев
🤩#ballet🤩
🇺🇿✨ Uzbekistan’s Lazgi ballet heads to Salzburg
The National Ballet of Uzbekistan will stage Lazgi. Dance of Soul and Love at Salzburg’s Großes Festspielhaus, bringing a centuries-old dance tradition to one of Europe’s top cultural venues 🎭🇦🇹
Originating in western Uzbekistan, Lazgi has evolved from a regional ritual into a global cultural symbol and is listed as UNESCO Intangible Cultural Heritage 🌍
The Salzburg production blends traditional choreography with classical ballet structure, combining ritual movement, contemporary staging and an original score 🎼💃
Organisers say the performance will serve as a cultural bridge between Central Asia and European audiences 🤝🌏
In recent years, the Lazgi ballet has toured Europe, the Middle East and Asia, transforming from folk heritage into an internationally recognised stage production 🌐✨
#Uzbekistan#Culture#Ballet
🖤🩰 Ramona de Saá, una de las fundadoras del #Ballet Nacional de #Cuba y una de las figuras más notables de la pedagogía de la #Danza en el mundo contemporáneo, falleció en la madrugada de este miércoles.
✍️📸 Cubadebate
#Holguín
Georges Bizet,是一位音乐“神童”,可惜英年早逝(36岁去世,这个profile和莫扎特有点类似)。大多数人可能熟悉的是他的歌剧《卡门》,但今天给大家分享一首Bizet的Symphony in C,是他17岁的时候写的一部作品,其实是他当时在Conservatoire de Paris学习的时候的作业😂这部作品在他生前没有发表,也没有公开演出,原因有很多争议,其中一个猜测是他在写这部作品的时候从他老师Gounod的Symphony in D中借鉴了很多。这部作品的手稿在1933年才被发现。
这首Symphony是传统的四个乐章,整体洋溢着青春愉快的氛围,也有很多catchy的旋律,个人觉得几个快乐章都有点歌剧overture的味道,是一首听着就想跳起来的作品~这首作品也被Balanchine用来创作成了芭蕾舞,今天就分享这个版本吧~
#frenchcomposer#bizet#symphony#ballet
https://www.youtube.com/watch?v=Fn1ZVGp0plc