Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
📱X8 seriyasiga yana ikki model qo‘shildi — OPPO Find X8s va Find X8s+
ℹ️ Bu modellarning har ikkalasi OPPO taqdim etgan flagman Find X8 Ultra’ning soddalashtirilgan versiyalari hisoblanadi. Ekranlar kichikroq, chipset va kameralar kamroq quvvatli, lekin dizayn flagman bilan bir xil.
⚙️ Qizig‘i shundaki, Find X8s va Find X8s+’ning ekran diagonali va kamera periskoplari farqli bo‘lsa-da, xotira hajmi bir xil bo‘lgan versiyalarining narxi aynan bir xil. Bu holat xaridorlarga narxdan qat’i nazar, o‘lchamga qarab tanlash imkonini beradi.
📱 Displeylar:
X8s: 6,32", 2640×1216, AMOLED, 120 Hz
X8s+: 6,59", 2760×1256, AMOLED, 120 Hz
👩💻 Chipset: MediaTek Dimensity 9400+
📸 Kameralar:
X8s: 50 MP (f/2.0) + 50 MP periskop (f/2.8, 3.5x) + 32 MP selfi
X8s+: 50 MP (f/2.0) + 50 MP periskop (f/2.6, 3x) + 32 MP selfi
💾 Xotira variantlari:
X8s: 12+256, 12+512, 16+256, 16+512, 16+1024 GB
X8s+: 12+256, 12+512, 16+512, 16+1024 GB
📡 Aloqa: 5G, NFC, Wi-Fi 7, Bluetooth 5.4 LE
🔐 Biometriya: ekran osti barmoq izi skaneri, yuzni aniqlash
💧 Suvga chidamlilik: IP68 / IP69
🔋 Batareya va zaryadlash:
X8s: 5700 mAh, 80W simli, 50W simsiz, 10W teskari zaryad
X8s+: 6000 mAh, 80W simli, 50W simsiz, 10W teskari zaryad
💰 Boshlang‘ich narx: $574
➡️#oppo | Birinchi raqamli IT-Blog
📱📱 Find N5: Buklama smartfonlarning yangi avlodi
🚀 OPPO Find N5 2025-yil 20-fevralda taqdim etiladi va u dunyodagi eng ingichka buklama smartfon bo‘lishi kutilmoqda.
⚙️ Asosiy xususiyatlari:
📱 8,12 dyuymli ichki ekran
⚡️ Snapdragon 8 Elite protsessori
💾 16 GB operativ va 512 GB ichki xotira
🔋 5 600 mA·soat batareya, 80 W tezkor zaryad va 50 W simsiz zaryadlash
📸 50 MP asosiy kamera, keng burchakli va telefoto linzalari
🤖 Qurilmaga DeepSeek-R1 sun'iy intellekt modeli integratsiyalangan, bu esa qidiruv va tasvir yaratish imkoniyatlarini yanada yaxshilaydi.
🎨 Ranglar: Cosmic Black va Misty White
⌚️ Taqdimotda, shuningdek, OPPO Watch X2 aqlli soati ham namoyish etiladi.
➡️#oppo | Birinchi raqamli IT-Blog
📱 OPPO Reno 13 va Reno 13 Pro: Yangi imkoniyatlar bilan taqdim etildi
ℹ️ Reno 13 6,59 dyuymli, Pro modeli esa 6,83 dyuymli AMOLED ekran bilan ta’minlangan. Har ikkisi ham 120 Hz yangilanish chastotasini qo‘llab-quvvatlaydi. Ikkala qurilmada ham Dimensity 8350 protsessori o‘rnatilgan.
📸 Reno 13 50 MP asosiy, 8 MP keng burchakli va 50 MP selfi kameraga ega. Reno 13 Pro esa IMX890 asosiy kamera, 8 MP keng burchakli, 50 MP periskop va 50 MP selfi kamerasi bilan jihozlangan.
💾 12+256 GB dan 16+1024 GB gacha variantlari mavjud.
🔋 Reno 13 5600 mA·soat quvvatga ega bo‘lib, 80 W tez quvvatlanish bilan keladi. Pro modeli esa 5800 mA·soat, simli va 50 W simsiz quvvatlanish imkoniyatiga ega.
💧 Qurilmalar IP68/IP69 suv va changdan himoya sertifikatiga ega.
💵 Reno 13 373 dollardan, Reno 13 Pro esa 469 dollardan boshlanadi. Smartfonlar o‘rtacha narx segmentida yuqori sifatni ta’minlaydi.
➡️#oppo | Birinchi raqamli IT-Blog