TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 1 слични објави

Пребарај: #shimoliyqutb

当前筛选 #shimoliyqutb清除筛选
ТФ НИЯУ МИФИ

@mephi_life · Post #5193 · 05.05.2025 г., 12:26

😮Уникальный шанс: путешествие на Северный полюс для школьников Узбекистана Стартовал отбор на международный научно-просветительский проект «Ледокол знаний». Участники проекта отправятся в арктическую экспедицию к Северному полюсу на настоящем атомном ледоколе! Их будет ждать насыщенная образовательная программа: лекции, мастер-классы, квизы и многое другое. ✅Кто может принять участие? К участию приглашают школьников 14-16 лет из 20 стран мира, включая Узбекистан ✅Как проходит отбор участников? Конкурсный отбор пройдёт в 3 этапа и завершится 20 июня Все подробности проекта на сайте. О проекте «Ледокол знаний» ➖Научно-просветительский проект «Ледокол знаний» организован сетью Информационных центров по атомной энергии (ИЦАЭ) при поддержке госкорпорации «Росатом». ➖За 5 лет участниками арктических экспедиций на Северный полюс стало более 350 одарённых школьников. ➖VI международный научно-просветительский проект «Ледокол знаний» в 2025 году приурочен к 80-летию российской атомной отрасли и 500-летию начала освоения Северного морского пути. 🌎 Переходите на сайт, изучайте подробности, отправляйте друзьям и знакомым. Это уникальный шанс для подростков! 〰️〰️〰️ 😮Ajoyib imkoniyat: O`zbekistondagi maktab o`quvchilari uchun Shimoliy qutbga sayohat «Bilim muzyorar kemasi»nomli xalqaro ilmiy-ma`rifiy loyihaga tanlov boshlandi. Loyiha ishtirokchilari haqiqiy atom muzyorar kemasida Shimoliy qutbga artktik ekspeditsiyaga yo`l olishadi! Ularni ajoyib ta`lim dasturi kutmoqda: ma`ruzalar,master-klass, viktorinalar va boshqalar. ✅Kimlar ishtirok etishi mumkin? Dunyoning 20ta mamlakati, jumladan O`zbekistondan 14-16 yoshli maktab o`quvchilari taklif qilinadi. ✅O`quvchilarni saralash qanday amalga oshiriladi? Tanlov 3 bosqichda o`tkaziladi va 20-iyunga qadar yakunlanadi. Batafsil ma`lumot loyiha saytida mavjud. «Bilim muzyorar kemasi» loyihasi haqida ➖Ilmiy-ma`rifiy loyiha bo`lgan «Bilim muzyorar kemasi» Atom energetikasi bo`yicha axborot markazlari tarmog`i (AEAM) tomonidan «Rosatom» ko`magida tashkil etilgan. ➖So`nggi 5 yil ichida Shimoliy qutbga Arktik ekspeditsiyalarida 350dan ortiq iqtidorli maktab o`quvchilari ishtirok etgan. ➖2025-yildagi VI xalqaro ilmiy-ma`rifiy ekspeditsiya Rossiya atom sanoatining 80 yilligi va Shimoliy dengiz yo`lining o`zlashtirilishi boshlanishining 500 yilligiga bag`ishlanadi. 🌎Saytga tashrif buyuring, barcha tafsilotlar bilan tanishing, do`stlaringiz va tanishlaringizga yuboring. Bu o`smirlar uchun ajoyib imkoniyat! #ЛедоколЗнаний#СеверныйПолюс#Росатом#BilimMuzyorarkemasi#ShimoliyQutb#Rosatom#clearenergy@clearenergy Чистая Энергия ӏ Sof Energiya🇺🇿 - все про безуглеродную энергетику Узбекистана и мировые новости, подписывайтесь и будьте в курсе событий.