TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #physicaltechnicalinstitute

当前筛选 #physicaltechnicalinstitute清除筛选

🤔Yarimo‘tkazgichlar sohasini rivojlantirish istiqbollari 🎓 Biznes va tadbirkorlik oliy maktabida Malayziya va Koreya ekspertlari, vazirliklar, ilmiy-tadqiqot institutlari va oliy ta’lim muassasalari vakillari ishtirokida yarimo‘tkazgichlar sanoatini rivojlantirish masalalariga bag‘ishlangan davra suhbati bo‘lib o‘tdi. 🌀 Tadbir ochilishida Biznes va tadbirkorlik oliy maktabi vakili so‘zga chiqib, O‘zbekistonda yarimo‘tkazgichlar sohasini rivojlantirish istiqbollari, ilmiy-amaliy tadqiqotlarning ahamiyati hamda xorijiy tajribani o‘rganish zarurligini ta’kidladi. ✅ Shundan so‘ng ishtirokchilar kadrlar tayyorlash, ilmiy ishlanmalarni amaliyotga tatbiq etish va ishlab chiqarishda mahalliylashtirish masalalarini muhokama qildilar. Malayziya va Koreya ekspertlari o‘z mamlakatlari tajribasi, mavjud muammolar va ularni yechish bo‘yicha olib borilayotgan ishlarga oid ma’lumotlar bilan o‘rtoqlashdi. Shuningdek, “O‘zeltexsanoat” uyushmasi, Ion-plazma va lazer texnologiyalari instituti, Yarimo‘tkazgichlar fizikasi va mikroelektronika instituti, hamda boshqa tashkilotlarning tashabbuslari taqdim etildi. 🤝 Yakunida ishtirokchilar ilmiy ishlanmalar asosida yarimo‘tkazgich mahsulotlari ishlab chiqarish, komponentlarni mahalliylashtirish, kadrlar tayyorlash va xalqaro hamkorlikni kengaytirish bo‘yicha hamkorlik qilishga kelishib oldilar. 🇷🇺RU 🇬🇧ENG #GSBE#GraduateSchool#PhysicalTechnicalInstitute#StartupProjects 🔝Web-site |🔝Facebook | 🔝Instagram | 🔝Youtube

🧊Yarimo‘tkazgichlar va mikroelektronika sohasida innovatsion hamkorlik yo‘lga qo‘yilmoqda 🇺🇿O‘zbekiston Fanlar akademiyasi Fizika-texnika instituti va Biznes va tadbirkorlik oliy maktabi o‘rtasida yarimo‘tkazgichlar va mikroelektronika sohasini rivojlantirish bo‘yicha innovatsion hamkorlik yo‘lga qo‘yilmoqda. Uchrashuvda institutda yarimo‘tkazgichlar yo‘nalishida olib borilayotgan ilmiy-tadqiqot ishlar, institut yo‘nalishining boshqa ITlardan farqi va o‘rni, dizayn markazi tashkil etish loyihasi, xalqaro hamkorlik, O‘zbekistonda yarimo‘tkazgich va mikroelektronika mahsulotlari ishlab chiqarish xolati va imkoniyatlari, startap loyihalar amalga oshirish bo‘yicha o‘zaro hamkorlik masalalari muhokama qilindi. 🔹Batafsil 🇷🇺RU 🇬🇧ENG #GSBE#GraduateSchool#PhysicalTechnicalInstitute#StartupProjects 🔝Web-site |🔝Facebook | 🔝Instagram | 🔝Youtube