Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
DogData Weekly Report #11
Hello Everyone. We hope your week was great!💥
What an exciting moment it has been. From our records, we have seen how massive we have grown and also the aggressive nature of our push. What else is new?📢
Find out more news in our #WeeklyNews
👉https://medium.com/@dogsdata/dogdata-weekly-report-11-f41ff50136f4
We are so happy for having you here 🚀
As you know DogData Team started to add #WeeklyNews about the project on Medium.
Follow the link, support the DogData project with claps 👏👏and stay up to date with the hottest news! 🔥🔥
https://medium.com/@dogsdata
“Yangi O‘zbekiston” universitetida o'tgan hafta davomida oʻtkazilgan uchrashuv va muhim tadbirlar
🔹Safia Café & Bakery kompaniyasi vakillari bilan uchrashuv bo‘lib o‘tdi;
🔹Universitetimiz talabasi Norvegiyadagi xalqaro talabalar festivalida qatnashdi;
🔹"Yangi O'zbekiston" universitetida "Kiberxavfsizlik sammiti 2025" bo‘lib o‘tdi;
🔹Ota-onalar kongressi o'tkazildi.
🔁English
➖➖➖➖➖➖➖➖➖➖➖➖
#haftalikyangiliklar#weeklynews
⬇️ Biz ijtimoiy tarmoqlarda:
Veb-sayt | Telegram | Instagram | Facebook
“Yangi O‘zbekiston” universitetida hafta davomida oʻtkazilgan uchrashuv va muhim tadbirlar
🔹“Yangi O‘zbekiston” universiteti rahbariyati Germaniyada bo‘lib o‘tgan konferensiyada ishtirok etdi;
🔹“Yangi O‘zbekiston” universiteti talabasi Shveytsariyada ilmiy konferensiyada ishtirok etdi;
🔹"Harbiy qismda bir kun" tadbiri o'tkazildi;
🔹“Yangi O‘zbekiston” universiteti talabalari "CanSat" musobaqasida ishtirok etdi.
🔁English
➖➖➖➖➖➖➖➖➖➖➖➖
#haftalikyangiliklar#weeklynews
⬇️ Biz ijtimoiy tarmoqlarda:
Veb-sayt | Telegram | Instagram | Facebook
“Yangi O‘zbekiston” universitetida hafta davomida oʻtkazilgan uchrashuv va muhim tadbirlar
🔹“Yangi O‘zbekiston” universiteti talabalari Chimyonda sayohatda bo‘lishdi
🔹Bilimga chanqoq yosh mehmonlar kutib olindi!
🔹O‘quvchilar “Yangi O‘zbekiston” universiteti bilan tanishdi
🔹Talabalarimiz “Universal Horses Stable” ot klubida unutilmas kunni o‘tkazdi
🔁English
➖➖➖➖➖➖➖➖➖➖➖➖
#haftalikyangiliklar#weeklynews
⬇️ Biz ijtimoiy tarmoqlarda:
Veb-sayt | Telegram | Instagram | Facebook
“Yangi O‘zbekiston” universitetida hafta davomida o'tkazilgan uchrashuv va muhim tadbirlar
🔹“Yangi Oʻzbekiston” universitetida profilaktik tadbir tashkil etildi
🔹“Yangi Oʻzbekiston” universiteti va School 21 hamkorligida IT sohasidagi yangi imkoniyatlar
🔹Milliy estrada simfonik orkestri kontserti o'tkazildi
🔹“Yangi Oʻzbekiston” universiteti talabalari “Jinlar bazmi” spektaklini tomosha qilishdi
🔁English
➖➖➖➖➖➖➖➖➖➖➖➖
#haftalikyangiliklar#weeklynews
⬇️ Biz ijtimoiy tarmoqlarda:
Veb-sayt | Telegram | Instagram | Facebook
“Yangi O‘zbekiston” universitetida hafta davomida o'tkazilgan uchrashuv va muhim tadbirlar
🔹 “Yangi O‘zbekiston” universitetida 2025-yilning ilk professor-o'qituvchilar yig‘ilishi bo‘lib o‘tdi.
🔹 Ipak yoʻli banki vakillari bilan uchrashuv oʻtkazildi.
🔹 MAAB akademiyasi vakillari bilan uchrashuv oʻtkazildi.
🔹 “Yoshlar o‘rtasida kiberjinoyatchilikka qarshi kurashish va uning oldini olish” mavzusida ma’ruza o‘tkazildi.
🔁English
➖➖➖➖➖➖➖➖➖➖➖➖
#haftalikyangiliklar#weeklynews
⬇️ Biz ijtimoiy tarmoqlarda:
Veb-sayt | Telegram | Instagram | Facebook
“Yangi O‘zbekiston” universitetida hafta davomida o'tkazilgan uchrashuv va muhim tadbirlar
🔹Koreys tili oʻqituvchilari uchun qayta tayyorlov kurslari tashkil etildi.
➖
🔹Germaniyaning Deutsche Bahn AG (DB) kompaniyasi bilan uchrashuv oʻtkazildi.
➖
🔹Xitoy energetika kengashi vakillari bilan uchrashuv oʻtkazildi.
🔁English
➖➖➖➖➖➖➖➖➖➖➖➖
#haftalikyangiliklar#weeklynews
⬇️ Biz ijtimoiy tarmoqlarda:
Veb-sayt | Telegram | Instagram | Facebook
Weekly Recap | Addis Standard
Top stories of the week from Ethiopia and the region.
Watch the full recap.
https://youtu.be/Sm_a10BhwSA?si=1FfftVvZP-wBI7Ny
#Ethiopia#AddisStandard#EthiopiaNews#HornOfAfrica#WeeklyNews
Weekly Recap | Addis Standard
Top stories of the week from Ethiopia and the region. Watch the full recap.
#Ethiopia#AddisStandard#EthiopiaNews#HornOfAfrica#WeeklyNews
https://www.youtube.com/watch?v=OlJTzSXAltc