TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 1 слични објави

Пребарај: #sanoye

当前筛选 #sanoye清除筛选
Sandiq

@sandiqchamiz · Post #104 · 18.04.2026 г., 19:37

#adabiyot HUSNI TA'LIL – “chiroyli dalillash” demak. Unda shoir biror holatga asl sababni emas (!), o’zi to’qigan yolg’on sababni bog'laydi. Masalan, "Nega bulutdan yomg'ir quyiladi?" degan savolga shoir barcha diniy va ilmiy sabablarni chetga surib, o'z to'qimasi bilan javob beradi: "Yor ishqida holim xarobligini troposferadan ko'rib qolgan bulut rahmi kelib yig'lab yuboradi. Anavi suv yomg'ir emas, bulutning achinish ko'zyoshlaridir". (Deyamush) Qisqasi, husni ta'lilni "kiydirish san'ati" desa ham bo'ladi. Husni ta’lil qanday topiladi? Avvalo, bu san’at bir so’zda emas, balki butunbir baytda bo’lishini bilishimiz lozim. Qolaversa: 1. Baytning MAZMUNIni tushunish kerak. 2. Shoir QAYSI HOLATni izohlamoqchi ekanini aniqlash kerak. 3. Shoirning YOLG’ONi (husni ta’lil) nimadan iborat ekanini topish kerak. 1-MISOL Zanburi asal og’zi to’la shahd ekaninidin, Erningni ko’rub, bemaza deb bol to’kubdur. (Lutfiy) 1. MAZMUNI: Asalarining og’zi asal (shahd)ga to’la ekan. Sening (yorga murojaat qilinyapti) labingni tatib ko’rib, asalari: “Endi asal bemaza tuyulyapti”, - debdi-yu, to’kib yuboribdi. 2. QAYSI HOLAT? Asalarining nega asal qilishi. 3. “YOLG’ON” (husni ta’lil): Asalari go'yo yorning shirin labi oldida o’g’zidagi asalning ancha bemaza ekanini bilgach, asaldan voz kechibdi (uni tashlab yubordi). Izoh: Aslida, asalari o’zi uchun asal tayyorlaydi, boringki, Alloh uni shunday yaratgan. Lekin Lutfiy bu sabablarni chetga surib: “Asalari yorimning labi tufayli asal to’kishni boshlagan. Ungacha asal to'kmas edi”, - deya bizni “kiydirmoqda”. 2-MISOL Yangi oy qoshlari xijlatidin, Oylarda biror-biror ko’rinur. (Atoiy) Keling, bu baytga boshqa usulni qo'llasak. Deylik, Qamchibek ustozi (bu o'rinda Atoiy)dan bir savol so'raydi, ustozi uni "aldaydi". Qamchibek: - Ustoz, nega yangi oy bir oyda bir chiqadi? Ustoz: - Bo'tam, bunga sabab shuki, oy o'zini "Men eng go'zalman, "Miss Universe"man" deb yurar edi. Bir kuni yorning qoshlari o'zidan go’zalroq ekanini ko'rib, aytgan gaplari (karillab qo'ygani) uchun ming xijolat bo’lib, oyda bir martagina ko’rinish beradigan bo'ldi. Husni ta’lil san’atini qo’llash mahorati bo’yicha turkiy adabiyotda Lutfiyga teng keladigani bo’lmagan. Quyidagi birgina baytdagi topilmaga guvoh bo’lib, fikrimiz to’g’riligiga amin bo’lasiz. 3-MISOL Labingdin chun suchuklik qand o’g’urlar, Solurlar el ani suvg’a yalang’och. (Lutfiy) Qamchibek: - Ustoz, nega qandni yalang'ochlab suvga solamiz? Ustoz: - Shuni ham bilmaysanmi, suvni shirin qilish uchun-da. - Bo'tam, bilasanki, o'g'ri qo'lga tushsa, u qochib ketmasligi va xaloyiq yig'ilishi uchun uni yalang'ochlab, suvga (hovuzga) tashlab qo'yamiz. Qand ham o'g'ri: u shirinlikni (chuchuklikni) yorimning labidan o'margan. Shu bois uni ham yalang'ochlab suvga solib qo'yamiz. #sanoye @sandiqchamiz