Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
🌃Друзья, уже сегодня состоится грандиозный фестиваль Ural Music Night!✨
⠀
🎼 Весь город наполнится музыкой, и одна из самых ярких площадок ждёт вас в Доме Офицеров!
⠀
Мы делимся кадрами и эмоциями подготовки — последние штрихи, репетиции, настройка звука и света.
🔥Атмосфера уже по-настоящему праздничная!
⠀
🎶 Приходите за яркими эмоциями, живой музыкой и атмосферой настоящего праздника!
📍Ждём вас сегодня, 27 июня, в Доме Офицеров!
#UralMusicNigh
#UMN
🌃 Ural Music Night! ✨
❓Что вас сегодня ждёт❓
1⃣. На площади перед ОДО ❗
- Можно будет увидеть Танцевальный спектакль «Сказ»
🕰 Начало в 16.00
- Выступление Ансамбля железнодорожных войск
🕰Начало в 16.40
- Небольшой концерт от Ансамбля песни и пляски Центрального военного округа
🕰Начало в 17.20
- Уникальное направление музыки СКА- ПАНК группы Лампасы
🕰 Начало в 18.50
- Прекрасными песни военных лет вместе с группой «Запрещенные барабанщики»
Состав группы:
🥁Устюгов Александр
🥁Соловьев Иван
🥁Холмогоров Сергей
🥁Дылдина Илона
🕰Начало 19:30
2⃣. В большом зале ОДО
- Можно будет погрузится у атмосферу Испании с зажигательными танцами и живой музыкой. Исполнители музыкального жанра «Фламенко» перенесут вас в мир ярких эмоций. 💃🏾
🕰 Начало в 21.00
3⃣. В малом зале ОДО
- Вы насладитесь этнической музыкой, а именно гармонией индийских инструментов🪈
🕰 Начало в 16.30
🎶 Мы ждем вас 27 июня 2025 года🎶
#ОДО_Урал, #концерты, #UMN
💫Катарсис по-уральски: как группа «Ягода» заставляет плакать от счастья
Наследие Бажова, птицы Сирин и Алконост, русская тоска и рогатые кички — всё это сплелось в музыке группы «Ягода», выступившей на Ural Music Night. Мы поговорили с артистами о том, почему их сказочный фолк — это не бегство от реальности, а самое что ни на есть честное и прямое погружение в неё, где зрителям позволено плакать и водить хороводы.
Читайте интервью в разделе «Журнал» на нашем сайте.
#UMN#Екатеринбург#UralMusicNight2025#интервью
Туристы направили свой взор на Ural Music Night
🔥 110+ площадок.
🔥 3000+ артистов из самых разных жанров: от фолк-джаза до глиттер-попа, от панк-метала до хип-хопа, от академической музыки до драм-н-бейса.
#uralmusicnight2025#UMN#UralMusicNight#UMN2025#UralMusicNight2025
Уже завтра «Главный Проспект» примет участие в международном музыкальном фестивале в Екатеринбурге «Ural Music Night» и станет площадкой, где весь вечер будет царить атмосфера страсти и движения!
💕URAL MUSIC NIGHT💕
27 июня (пт) с 19:00 до 01:00
Школа танцев MaxDance проведёт вечеринку по клубной латине с мастер-классами и шоу-номерами тренеров. Каждый час будет проходить новый бесплатный мастер-класс по бачате.
➿➿➿➿➿➿➿➿➿➿
Итак, резюмируем программу:
19:00 мастер-класс по бачате от Максима Щербакова (основатель MaxDance, чемпион Кубка Мира)
20:00 открытые соревнования по бачате - от начинающих до профессионалов
22:00 Мастер-класс по бачате от тренеров MaxDance
22:20 Массовый танец сальса
22:20 Вечеринка по клубной латине (бачата-сальса) с мастер-классами каждые полчаса и показательными выступлениями
Если вы хотите продлить Ночь музеев — вам к нам!
С любовью,
Ваш «Главный проспект»🤍
#UMN#Екатеринбург#UralMusicNight2025#Танцы#Сальса#Бачата#главныйпроспект
💕URAL MUSIC NIGHT💕
27 июня (пт) с 19:00 до 01:00
Друзья, мы рады сообщить, что «Главный Проспект» примет участие в международном музыкальном фестивале в Екатеринбурге «Ural Music Night» и станет площадкой, где в следующую пятничную ночь будет царить атмосфера страсти и движения!
Школа танцев MaxDance проведёт вечеринку по клубной латине с мастер-классами и шоу-номерами тренеров. Каждый час будет проходить новый бесплатный мастер-класс по бачате.
➿➿➿➿➿➿➿➿➿➿
Итак, резюмируем программу:
19:00 мастер-класс по бачате от Максима Щербакова (основатель MaxDance, чемпион Кубка Мира)
20:00 открытые соревнования по бачате - от начинающих до профессионалов
22:00 Мастер-класс по бачате от тренеров MaxDance
22:20 Массовый танец сальса
22:20 Вечеринка по клубной латине (бачата-сальса) с мастер-классами каждые полчаса и показательными выступлениями
Если вы хотите продлить Ночь музеев — вам к нам!
С любовью,
Ваш «Главный проспект»🤍
#UMN#Екатеринбург#UralMusicNight2025#Танцы#Сальса#Бачата#главныйпроспект
🔥 Площадки UMN 2025: World Music «Изумрудный город»
📍Парк Маяковского (Летний театр) (ИЗМЕНЕНИЯ В ПЛОЩАДКЕ)
📍 Актуальные тайминги на сайте и в приложении
📍 Фолк, этника, фолктроника, арт-фьюжн
Парк Маяковского станет домом для главной фолк-сцены фестиваля — World Music «Изумрудный город», где встретятся культуры, ритмы и стили со всей России.
🎤Хедлайнеры:
22:10-23:00
Регистрация на выступление
— Олег Митяев — автор и исполнитель песен, ставших частью национальной культурной памяти — «Лето — это маленькая жизнь», «Как здорово, что все мы здесь…», «Не наточены ножи» и многих других — Олег Митяев выступит с концертом в летний вечер, где каждая строчка отзовётся в сердцах слушателей;
20:50–21:30
— Ягода — современный фолк, этно и чарующий вокал. Более 600 тыс. просмотров на YouTube и финалисты «Моспродюсер.LINK»;
21:30–22:10
— Изумруд — уникальный арт-фьюжн: классика, джаз, фолк, этника, арт-рок. Участники Олимпиады в Сочи и шоу на НТВ.
🎶 Также выступят:
Роза Карим, Мелисса, Einar,
Бала́кирь,Варья,ЖИВаGO,BELOBOKA,ХВОЯ,СавелiчъБэнд.
❤️🔥 Ночь пройдёт 27 июня 2025, Екатеринбург, Россия
#UMN#Екатеринбург#UralMusicNight2025#Площадки#Фолк#Фолктроника#АртФьюжн#Этника#ЖивойЗвук