TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #iteca

当前筛选 #iteca清除筛选
“OʻzTMK” AJ | Rasmiy kanal

@uztmk_official · Post #3182 · 26.10.2025 г., 09:37

#TMK #UIMF2025 #ITECA 🎙TMK ekspertlari – UIMF 2025 sahnasida! Ma’lum qilganimizdek, 28–29-oktabr kunlari Toshkentdagi “O‘zekspomarkaz” majmuasida UIMF 2025 forumi bo’lib o’tadi. ✅UndaO‘zbekiston texnologik metallar kombinati (TMK) vakillari ham spiker sifatida ishtirok etib, xalqaro auditoriya bilan o‘z tajribasi, g‘oyalari va istiqboldagi loyihalari bilan o‘rtoqlashadi. 🌎Forumning maqsadi – Markaziy Osiyo tog‘-kon va metallurgiya sanoatida innovatsion texnologiyalar, barqaror yechimlar va global hamkorlikni rivojlantirishdir. TMK spikerlari: Han Ilhan, Boshqaruv raisi maslahatchisi 💡Mavzu: “Kritik minerallar: global ta’minot zanjirlarida barqarorlikni ta’minlash.” Amir Abidov, Fan va taraqqiyot bo‘yicha boshqaruv raisining o‘rinbosari 💡Mavzu: “Ilm-fan va innovatsiyalar – O‘zbekistonning texnologik metallar sohasida yangi bosqich.” Timur Xikmatullaev, Boshqaruv raisining global integratsiya masalalari bo'yicha maxsus vakili-ilmiy texnik hamkorlik boshqarmasi boshlig'i 💡Mavzu: “Texnologik metallar sohasida innovatsiyalar va xalqaro ilmiy hamkorlikning yangi bosqichi.” Kelajak metallari dunyosida TMK bilan hamnafas bo‘ling! 📍UIMF 2025 | 28–29-oktabr | O‘zekspomarkaz, Toshkent 🫥🫥🫥 📎На русском языке 📎In English 🫥🫥🫥 ✅TMK matbuot xizmati 🌐Web-site|🔵Facebook |📷Instagram| 🎰LinkedIn|🎬Youtube|🚀Telegram

“OʻzTMK” AJ | Rasmiy kanal

@uztmk_official · Post #3181 · 26.10.2025 г., 09:12

#TMK#UIMF2025 #MiningMetalsUzbekistan2025 #ITECA ⚡️TMK poytaxtimizdagi “O‘zekspomarkaz”da o‘tkaziladigan konchilik va metallurgiya sanoatining eng yirik tadbirlarida ishtirok etadi: ➡️28–29-oktabr – UIMF 2025 forumi ➡️28–30-oktabr – Mining Metals Uzbekistan 2025 ko‘rgazmasi 🔥 Bu ikki yirik platforma Markaziy Osiyo tog‘-kon sanoatining strategik markazi bo‘lib, 🏆 TMK bu yil tadbirning oltin homiysi sifatida O‘zbekistonning texnologik salohiyatini global miqyosda namoyon etadi. 🌎 TMK global auditoriyaga “Kelajak metallari” konsepsiyasi doirasida O‘zbekistonning istiqbolli loyihalarini taqdim etadi: Asosiy yo‘nalishlar: ✔️ “Mine–Metal–Market” tamoyiliga asoslangan integratsiyalashgan qiymat zanjiri; ✔️Qazib olishdan tortib yuqori qo‘shilgan qiymatli mahsulotgacha bo‘lgan to‘liq ekotizim; ✔️ ESG va “Green Mining” asosida barqaror ishlab chiqarish yondashuvi; ✔️ Xalqaro ilmiy markazlar va texnologik transfer platformalarini rivojlantirish tashabbuslari. 💬TMK ushbu tadbirlarda nafaqat O‘zbekistonning resurs salohiyatini, balki global konchilik sanoati uchun ishonchli, ekologik va innovatsion yechimlarni taklif etadi. 📍#2-pavilon, D-150 stend Sanoat, texnologiya va investitsiyalar chorrahasida Sizni TMK kutmoqda! ⚡️TMK bilan barqaror va texnologik kelajakni birga quvvatlang! 🫥🫥🫥 📎На русском языке 📎In English 🫥🫥🫥 ✅TMK matbuot xizmati 🌐Web-site|🔵Facebook |📷Instagram| 🎰LinkedIn|🎬Youtube|🚀Telegram