Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
🚨 Sneak Peek Alert about $SING token🚨
Big changes are coming to Tycoon Game! 🎤✨
Soon, withdrawal fees will no longer be paid in TON. Instead, we’re switching to $SING! 💎
👉 Start stacking your $SING now to stay ahead! 🔑
Tips: If you have not got $SING, easily buy at:
- BingX: https://bingx.com/en/spot/SINGUSDT/
- CoinEx: https://www.coinex.com/en/exchange/sing-usdt
#SingSing#TycoonGame#GameFi#Web3
🔧Tycoon Game Maintenance Notice🔧
Tycoon Game will be temporarily closed for maintenance starting at 7:00 AM UTC. We'll keep you updated on the reopening time.
After this maintenance, SING will be integrated into the game as announced: https://t.me/singsingchannel/1050
Thank you for your patience and support! 🌟
#GameFi#TycoonGame#Maintenance
🚀 How to Play SingSing Tycoon: Step-by-Step Guide 🚀
1️⃣ Buy $KARA: Upgrade buildings and cashiers to boost Cash income! 🔝
2️⃣ Complete Missions: Invite friends for $KARA, RUBY, and potential Cash Back in TON. 💵
3️⃣ Purchase Lucky & Kara Boxes: Get KTV NFTs or $KARA. Daily sales on SingSing’s MarketPlace! 🛍
4️⃣ Unbox Items: Go to 'KTV Game', enter 'Vault', and claim your NFTs and $KARA.
5️⃣ Unlock Floors: Use KTV NFTs to create more karaoke rooms for increased Cash income. 💸
6️⃣ Equip Karaoke Box NFTs: Boost Cash income in karaoke rooms! 💰
7️⃣ Spend $KARA and Cash: Use for features like Lucky Spin and NFT Marketplace coming soon! 🎯
8️⃣ Join Club Competition: Earn Airdrop Vouchers convertible to $SING after TGE! 🌟
#SingSing#TycoonGame#PlayToAirdrop
🚨 3 hours to go until Lucky Box Session 2 sale!
💰 Price:
✅ 150 Boxes for All: 800 RUBY each
✅ 50 Boxes for Pioneer NFT Holders: 400 RUBY each
🗓 Sale Time: 13:00 UTC, Sep 10
You'll soon be able to claim your NFT because SingSing Tycoon game is launching very soon! 🎉Get ready to dive into the karaoke empire! 🎤
#SingSing#LuckyBox#NFTs#TycoonGame
🎤SingSingers, good news!🎤
The TON withdrawal feature in SingSing is now re-enabled! Withdraw your TON and enjoy the smooth gaming experience. 💼💎
Get ready for more epic adventures in the Tycoon Game!
#SingSing#TON#GameWithdrawals#TycoonGame
🎤Announcement | Chat | X (Twitter) | Website | Game
🎤 How to Leverage Your NFTs in Tycoon Game 🎤
💥 Right now, you can equip both types of NFTs to boost your earnings! Dive into below:
1️⃣ Karaoke Box NFT
🔧 Boost earning speed in karaoke rooms from 1.5x to 8x (depending on rarity).
Common ➡️ x1.5 earning speed
Uncommon ➡️ x2 earning speed
Rare ➡️ x4 earning speed
Epic ➡️ x6 earning speed
Legendary ➡️ x8 earning speed
How to equip:
- Tap the only 'Equip' button and select your Karaoke Box NFT.
- After equipping, the NFT ID will appear as the room number.
- To unequip, tap the 'Equip' button again, press '-' button to unequip NFT
2️⃣ KTV NFT
🔧 Unlock 1-15 new floors, adding more rooms and boosting your earnings!
Common ➡️ +1 floor
Uncommon ➡️ +3 floors
Rare ➡️ +5 floors
Epic ➡️ +10 floors
Legendary ➡️ +15 floors
How to equip:
- Tap 'New Floor,' select your KTV NFT, and you're all set!
- New floors will unlock, with the NFT image displayed above the highest floor.
- To unequip, tap the KTV NFT image and press 'Unequip'.
#NFT#KTV#SingSing#Tycoongame
🎉KARA Launchpool has officially ended!🎉
Congrats to all stakers for earning huge rewards from the 1,000,000 KARA pool!
🏆 It’s time to redeem your rewards now:
D
1️⃣ Tap Detail Pool2️⃣ Hit the Redeem button 3️⃣ Confirm the transaction in Metamask4️⃣ Check your KARA balance in Tycoon Game and keep using $SING to join the AURA Launchpool!
🚀 The journey doesn’t stop here. Let’s keep thriving!
If you want more $SING, easily buy at:
- BingX: https://bingx.com/en/spot/SINGUSDT/
- CoinEx: https://www.coinex.com/en/exchange/sing-usdt
- SingSing Mini App: https://t.me/SingSing_TG_bot/app?startapp=_wallet(guideline)
#KARA#Launchpool#TycoonGame#Web3Gaming
🎉 Why Own a Tycoon Lucky Box? 🎉
1️⃣ The Tycoon Box is your chance to get early NFTs at a cheap price, purchasable with free RUBY you’ve mined 💎
2️⃣ Claim your NFTs right after the SingSing Tycoon game launch 🚀
3️⃣ These NFTs will be key to boosting your income fast in the new game 💰
4️⃣ Trade your NFTs freely on our Marketplace 📈
Note 🤫: We are still selling session 2 with less than the last 100 Boxes left, grab them now🎁
#SingSing#LuckyBox#NFT#RUBY#Tycoongame