Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
defendnot 一键关闭 Windows Defender 的工具 #defender
一款用于禁用 Windows Defender 的工具,支持一键安装和持久生效,通过直接调用 Windows 安全中心(WSC)接口,注册虚拟杀毒软件,实现对系统自带的 Defender 实时防护服务的彻底禁用。
https://github.com/es3n1n/defendnot/releases
и немножно прекрасных дорожных моментов:
❔ При крещении вам залили в ботинки примерно ведро воды, ваши действия?
Отвечает Жоао!
Some beautiful road moments to share:
❔ During your baptism, your boots took about a bucket of water, what do you do?
João answers!
#defender
@MashaLelyanova
#defender#keyboard
🔥Бюджетные клавиатуры бренда Defender
LEGION GK‑010DL
➡️Тип: Проводная, интерфейс USB
➡️Раскладка: Полноразмерная (104 клавиши, включая цифровой блок)
➡️Механизм: Мембранные переключатели
➡️Подсветка: RGB
➡️Длина кабеля: ~1,5 м
➡️Anti-ghost: есть (до 19 клавиш)
➡️Ресурс клавиш: около 60 млн нажатий
➡️Вес: ~0,78 кг
➡️Цвет: черный
💳15 y.e
💳15 y.e.
HAWK GK-418
➡️Тип: Механическая клавиатура
➡️Switches: Outemu Brown
➡️Клавиши: 97 штук.
➡️Подключение: Проводное, USB (1.5 м кабель)
➡️Подсветка: Радужная (RGB), ~12 режимов.
➡️Сила нажатия: ~45 ± 10 г (в версии с Red)
➡️Ход клавиш: 4.0 мм, срабатывание ~2.0 мм ± 0.6
➡️Ресурс нажатий: ~5 миллионов нажатий
➡️Материал кейкапов: ABS, технология double-injection (символы не сотрутся)
➡️Размеры и вес: примерно 385 × 136 × 35 мм, вес ~710 г (в версии с Brown)
💳25 y.e
BLITZ GK-240L
➡️Тип: Механическая клавиатура
➡️Переключатели: Outemu Blue (щелкающие)
➡️Клавиши: 87 (80% / TKL)
➡️Подключение: Проводное, USB (1.5 м кабель)
➡️Подсветка: Радужная RGB, ~12 режимов
➡️Сила нажатия: ~60 ±10 г
➡️Ход клавиш: 4.0 мм, точка срабатывания ~2.0 мм
➡️Ресурс нажатий: 10 млн нажатий
➡️Регулировка угла: выдвижные ножки
➡️Габариты: примерно 360 × 135 × 37 мм
➡️Вес: ~650 г
💳25 y.e
IVORY GK-579
➡️Тип: механическая
➡️Переключатели (Switches): Outemu Red (линейные)
➡️Количество клавиш: 87 (без цифрового блока)
➡️Подключение: проводное, USB (USB Type-A)
➡️Кабель: длина ~1,5 м
➡️Подсветка: RGB, 17 режимов
➡️Материал кейкапов: ABS, технология double-injection (символы не стираются)
➡️Ресурс нажатий: ~5 миллионов нажатий
➡️Сила нажатия: 60 ± 15 г
➡️Размеры: 358 × 135 × 30 мм
➡️Вес: ~0.62 кг
💳25 y.e
➖➖➖➖➖➖➖➖➖
📍 Локация: [Малая кольцевая дорога 8A]
⏰ Время работы: [с 10:00 до 20:00]
📞 +998338082030
🔵@Comping_admin
➖➖➖➖➖➖➖➖➖
🔵Telegram📷Instagram🟥Youtube
🔥🚗 Introducing the new Octa edition of the legendary Land Rover Defender , now officially the most powerful and fastest version of the model yet, thanks to its 635-horsepower V8 engine.
🔴Equipped with a "mild-hybrid" system, the V8 engine delivers up to 800 Nm of torque and pairs with an eight-speed automatic transmission. The new Defender can accelerate from 0 to 100 km/h in just 4 seconds and reach a top speed of 250 km/h.
🔴The driving electronics have been updated with several new modes, including "Fast Off-Road Driving," which features special ABS settings for unstable surfaces and off-road launch control for an active start.
Would you put the pedal to the metal in this Defender off-roading adventure?
🔥 — Absolutely!
👎 — Off-roading and high-speed driving don't mix
#LandRover#Defender
🇷🇺 ONORE ai CADUTI
Donetsk
Repubblica Popolare di Donetsk
Federazione Russia
5/8/2025
( ⚔️ Qui giace, tra gli altri, Motorola, il mitico comandante del battaglione Sparta ).
#donetsk#Donbass#motorola#russia#europa#Defender#italia#spartan#Spartak
https://t.me/gianlucaprocaccinireport