Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
TONCO fine-tuning pools feature and collab with Tonstakers
🌱Advanced Range Presets – users and projects can now customize their liquidity strategies with ready-made range presets tailored to the market and different needs. Advanced presets are available for pools paired with $USDT or $TON.
🍀 Each preset serves different goals, whether you’re a user looking to maximize earnings or a project launching a token on #TONCO. There’s no single “best” strategy – performance depends on market conditions and how actively you manage your position.
🍃 Below we will show each of the presets in short way, but you can read more in the guide from the TONCO team:
🟢Curve – a balanced exposure, best for low volatility period, stable pairs or key price levels in volatile pairs.
🟢DCA Buy / DCA Sell – perfect for buying or selling assets over time while earning fees.
🟢Buy Walls / Sell Walls – price protection and market depth, used to stabilize price movements and create resistance/support levels.
🟢Steps – controlled price progression, gradually increases price levels to manage early-stage price growth while preventing sudden surges.
❗️Be careful with risks. Advanced strategies can increase yield, but also require active management. DYOR before deploying liquidity.
🤩 TONCO DEX announced a partnership with Tonstakers – $tsTON has been officially added to the exchange. TONCO's liquidity provision in the $stTON / $USDT pair is now 10 times greater than on classic V2 exchanges, and is about 25%. Plus, additional accruals are currently underway rewards for farming in this pair.
🔥Also 2 new pools with TON old token #RAFFwere added. But the juice is still in the TON/USDT pair, where APR reaches 80%.
TONCO | Channel | Chat
Пример фармилки жетонов в сети TON.
Это пока единственное место куда я закинул свои жетоны #SCALE в стек.
Шаг 1. Свапнуть #TON на #SCALE.
https://dedust.io/swap
Шаг 2. Добавить в стек #SCALE.
https://tonraffles.app/jetton/staking
Таким образом можно 14 дней фармить жетон #RAFF.
APR: 1000% на текущий момент.
Не финансовый совет. Риски есть, гарантий нет.
Bidask: $RAFF & $WEB3 Listings, MyTonWallet & DeWallet Integration + Meme Contest
🏴Two new tokens are now live on Bidask:
• $RAFF — from the Ton Raffles ecosystem
• $WEB3 — from the .ton domain ecosystem
Both are now tradable in pairs against #TON. The WEB3/TON pool features boosted farming through August 5, with up to ~44% APR — rewards in $WEB3 scale based on daily trading volume:
➖ $12.5/day if volume > $10,000
➖ $25/day if volume > $15,000
➖ $37.5/day if volume > $18,000
➖ $50/day if volume > $20,000
➖ $67.5/day if volume > $23,000
➖ $75/day if volume > $25,000
🏆Bidask Meme Contest
Create a meme about Bidask Protocol, post it on X (Twitter) with the hashtag #BidaskMemeContest, and share it in the contest thread in the “meme contest thread” in the Bidask chat.
Only memes posted in both X and the chat thread will qualify.
Contest runs through August 7. Prizes include:
🥇 1st — Toy Bear #52238
🥈 2nd — Record Player #10315
🥉 3rd — Crystal Ball #3932
🏅 4th — Light Sword #7136
🏅 5th — Light Sword #72658
👛 Wallet Integrations
#MyTonWallet and DeWallet (by DFC ecosystem) have added Bidask DEX support — making it even easier to swap and farm.
📈 Top APRs on Bidask DEX right now:
• HYDRA/TON — ~1250% APR
• TON/USDT — ~87% APR
Bidask DEX |Channel
#Bidask#WEB3#RAFF#DeFi#YieldFarming#CryptoNews#CryptoTrading#TON#TONBlockchain#DEX