Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Healing garden connects people with the mending power of nature - https://www.agweek.com/lifestyle/home-and-garden/7066103-Healing-garden-connects-people-with-the-mending-power-of-nature#Nature#Garden@LovelyNature
🎃🦇#GAG Garden Ghoul 3🔥 Update Revealed!!!
#growagarden#garden#gag
👀🌻Garden Ghoul 3 UpdateRelease Date & Time:
⏳⏳⏳October 25 (this Saturday) at 9:15 PM
🔗New Powerful Pet: Vampire Bat??🧛🦇
Multiple plants submitting will get back! Are your Tropical, Woody, Berry, Fruit and Vegetable plants ready?! 🌱🌱🌱
*Prepare yourself!!!
🔗For More Event Leaks, Join Our 👉Wiki Updates👈 Channel on Discord.
🔗For More Real Player Experiences, Follow Our ✨Event Guide✨ Discord Channel.
Add @APKFreeDownloader_Bot to get any apk you want.
🎈Hot Game This Week🎈
How to earn 💰𝟏,𝟎𝟎𝟎,𝟎𝟎𝟎,𝟎𝟎𝟎¢ in Grow a #Garden
Play 🦖#Prehistoric Quests and roll in money:
1️⃣ Go to PRE-HISTORIC QUEST SHOP.
2️⃣ Trade Pets with Graham for a Stegosaurus.
3️⃣ Do the Dino Quests.
4️⃣ Stack up on ancient seeds for Bone Blossom.
5️⃣ Feed your Stegosaurus with Bone Blossom to duplicate your dino's value.
👀Watch our video "😎How I Made 1,000,000,000 sheckles with ONE Pet in Grow a Garden Prehistoric Update!" on YouTube for details!
#Root#Cause#Garden#Legacy
Join the Root Cause - Garden Legacy beta on ✈️#TestFlight
🔗 Link: https://testflight.apple.com/join/RtdG1Gcv
Shared by Dimitri
🥳🎊#GAG Next Event 🔎#Leaks
#gag🌱#growagarden❄️#garden #2026
⌛Start Time: January 4, 2:00 AM (UTC+8)
🌟New Pet Leaks:
1. Angoragoat
2. Calico
3. Celebrationbeetle
4. Galah cockatoo
5. German shepherd
6. Lioness
If you're looking for New Year's 🐉Dragon Trades, go visit 🛒TradeKitsune > Trade
Add @APKFreeDownloader_Bot to get any apk you want.
How to grow a forest in your backyard? - #Forest#Nature#Garden#Backyard#TEDtalks - https://www.ted.com/talks/shubhendu_sharma_how_to_grow_a_forest_in_your_backyard
🌱🌻#GAG#Beanstalk Part 2 Event Preview👀
🤯🤩A PROLONGED Weekly Event!!
☄️😝MORE Insane Admin Abuse!!
🔥⌛Start Time: Aug 23, 10:00 PM (Saturday)
End Time: Aug 30, 6:00 PM (Sunday)
#growagarden🌞#gag#beanstalk🐝#garden
[What's Coming?]
-An Expansion Beanstalk Event
-Admin Abuse War
-New stuff added to Garden Guide
-New seeds, pets, items, weather
Grow a Garden Pro Tips & Guides You May Like:
🎬Huge Rainbow Peacock OP Guide
🎬How To Get 50 Pet Pouches
🎬Best & Worst Pets Ranked
Add @APKFreeDownloader_Bot to get any apk you want.
🌻#GAG🌲#Beanstalk Event Preview‼️🎉🎉
⌛COMING SOON !!!
v1.19.0 | 🔥𝟖/𝟏𝟔
💥Convert fruits to Grean BeanBeanBeansssss?!!
I LOVE IT!!!🤩🤩🤩👏👏👏
🌱#growagarden🌞#gag#beanstalk🐝#garden
🔎More info about Grow a Garden Beanstalk Event (August 16)
Find more trending Grow a Garden Guides like 🎥How to Level up Your Pets Super Fast, 🎥French Fry Ferret Guide and 🎥How to Get Culinarian Chests on our YouTube channel.
Add @APKFreeDownloader_Bot to get any apk you want.