Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
🔥TELEGRAM v 3.16🔥
Telegram v3.16 reached Google Play.
➡️DATA & STORAGE-view-
— Network usage stats.
— Mobile data usage.
— Wi-Fi data usage.
— Roaming data usage.
➡️t.meLinks-view-
— you can use t.me instead of telegram.me
➡️CHAT FEATURES-view-
— Revoke/delete sent messages on private chats and normal groups.
— New Markdown (bold and italic) on Android.
— 'Report Spam' on secret chat.
— Recent files list when sharing a file.
➡️Improved CHATS UI-view-
— Scroll position fixed when switching to another chat and back.
— Floating date while scrolling chats.
— Single avatar when scrolling multi messages of the same user
— New emojis.
➡️Android-view-
— Send gifs directly via your Gboard/Chrooma keyboard.
— Fast action menu on your desktop (with your frequent chats).
Android v7.1.x or Android 6 + Nova Launcher v5.0
🌐viaTelegram Blog
#telegram#updates#features
🚀Telegram Geeks
🚀@geeksChannel
📑Quick Sticker Creator
❤️Graph Messenger 11.5.0
🗓Added from: January 28, 2024
The Sticker Creator was added in
version 7.0 on January 23, 2019.
#features#media#sticker
@GraphMessenger
@GraphMessengerTips
⭐Change The Order Of Favorite Stickers
Also, you can add more than 5 favorite stickers which will be saved in local.
Link to Settings
❤️Graph Messenger 11.9.0
🗓Added from: May 15, 2024
#features#sticker#favorites
@GraphMessenger
@GraphMessengerTips
🗑Touch And Hold On Delete Button To Removing Media File
❤️Graph Messenger 11.9.0
🗓Added from: May 15, 2024
#features#message#media#touch_and_hold
@GraphMessenger
@GraphMessengerTips
#️⃣Hashtags+, a place to track your favorite hashtags in the public posts.
❤️Graph Messenger 11.10.0
🗓Added from: June 20, 2024
#features#message#hashtags
#graph_messenger#telegram
@GraphMessenger
@GraphMessengerTips
🗂Quick Links: Instant Access to Your Essentials
Save time with a personalized menu of your most used links, chats, bots, and more. Easily add and access whatever you need, whenever you need it. It is possible to create folders and modify the icon for menu items.
Simply touch and hold the 'Chats' tab button in the main tab bar.
❤️Graph Messenger 12.5.1.0
🗓Added from: March 20, 2026
#features#menu#quick_links#graph_messenger#telegram
@GraphMessenger
@GraphMessengerTips