Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
#Dubai
Victims of panic: pets are being abandoned in Dubai amid escalation of the war with Iran
Following the escalation of the conflict involving the United States and Israel against Iran, cases of abandoned pets have surged in Dubai. Volunteers and veterinarians report a sharp increase in situations where cats and dogs are left on the streets or owners request euthanasia.
Amid continuing missile attacks by Iran on countries in the Persian Gulf, some residents of Dubai are abandoning their pets while trying to leave the region as quickly as possible. Veterinarians in the city say they are seeing a growing number of requests for pet euthanasia.
The organization K9 Friends Dubai, which helps find new homes for dogs in the United Arab Emirates, reports being overwhelmed with messages about abandoned animals. Representatives of The Barking Lot say local shelters are already full.
“Volunteers from animal rescue centers report hundreds more abandoned pets than usual, putting shelters on the brink of collapse, and some are no longer able to care for all the animals,” said shelter owner Aditi Guri.
Photos circulating on social media show dogs tied to street lamps and left without food or water.
Some residents attempting to flee the UAE through Oman were reportedly told they could not take their pets across the border. As a result, many cats and dogs have been left unattended in the desert. The charity War Paws notes that abandoning pets during wartime is unfortunately not a new problem.
☘️Read the latest environmental news on the @ekologuz page. Follow us and send your suggestions and wishes via @eklguz_bot
Instagram | Facebook | Twitter | Sayt | Youtube.
Дуров тоже купил билеты на Token2049 в #Dubai. Кто еще пойдет на его выступление о здоровом питании и как выжить голым в пустыне? Предлагаю организовать группу поддержки и встретится на конфе.) Ставьте 🔥 если будете на Tокене!
TON — LIVE: Pavel Durov Heads to Dubai
#Dubai#TON
The channel TON — LIVE reports that Pavel Durov is traveling to Dubai and promises good news in June.
Source: link
@tonlines
✅✅✅✅ Join Astra Nova's Airdrops for exclusive rewards & Astra Nova Web3 RPG game with AI, NVIDIA, & Shiba support, backed by #Dubai's Sanabil. Get ready guys
🎉 $RVV tokens rewards
👉 Sign up here :- https://blackpass.astranova.world?referral_code=520852486f6a
➖ Fill in profile data
➖ Complete tasks & collect points
👉 𝗛𝗲𝗮𝗱 𝘁𝗼 𝗠𝗶𝗻𝗶 𝗔𝗽𝗽 𝗗𝗲𝘃𝗶𝗮𝗻𝘁𝘀 𝗮𝗻𝗱 𝘁𝗮𝗰𝗸𝗹𝗲 𝘁𝗮𝘀𝗸𝘀 and play to tranfer your shards to blackpass address :- https://t.me/Deviants_FightClub_Bot?start=1048396301
#Note :- Don't skip guys IDO on January 27 and exchanges listing in February.
⚡️Notcoin Community: Invitation to Telegram Games Day in Dubai
#Telegram#Dubai
Notcoin Community invites game developers and contest participants to the Telegram Games Day event in Dubai, UAE, on April 27. This event will provide insights into the world of Telegram Games.
Source: link
@tonlines
Премии на физическом рынке нефти на Ближнем Востоке вблизи исторических максимумов
Трейдеры любят финансовые рынки – торги на бирже позволяют хеджировать поставки, играть на арбитраже и зарабатывать даже в отсутствие значимых рыночных движений; многие нефтяники – включая главу крупнейшей российской нефтяной компании, – напротив, настороженно относятся к «бумажной нефти», считая её «спекулятивной». При этом обычно биржевые рынки и рынки физических поставок дают схожие оценки стоимости нефти.
Сейчас этот механизм (на время) сломался. По данным Platts, премия для Platts cash Dubai / Oman к фьючерсу сейчас достигает $13,05/барр., приближаясь к историческому рекорду марта 2022 г., когда из-за начала СВО и санкций против России Platts cash Dubai торговался с премией в $13,22/барр. Рынок Dubai / Oman небольшой и приток покупателей, пытающихся купить «хоть какие-то» объемы для выполнения апрельской программы, вызвал такие значимые отклонения.
#Нефть#Dubai
Dubai 🇦🇪 Business Associates Program 2026 (Fully Funded)
Apply: https://opportunitiescorners.com/dubai-business-associates-program/
9 Months Program to Study and Work in Dubai.
The Program Covers Airfare, Stipend, Meals, Visa Support and Accommodation.
#Dubai#OpportunitiesCorners