TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 5 слични објави

Пребарај: #countdown

当前筛选 #countdown清除筛选
SingSing Announcement

@singsingchannel · Post #962 · 04.11.2024 г., 14:20

🚀 Only one week left until our IDO launches! The excitement is building up as we get closer to the big day. Get ready to join us on this incredible journey! #IDO#Countdown#SingSing🎉 🎤Announcement | Chat | X (Twitter) | Website | Game

SingSing Announcement

@singsingchannel · Post #952 · 01.11.2024 г., 14:08

🚀 Let’s Countdown Together! 🚀 The big day is coming—SingSing’s IDO is set for November 11! 🎉 Get ready for an epic sale event and your chance to grab $SING! 🔥 Countdown with us on Website and SingSing Mini App! Mark your calendars, bring your best game, and let’s make this an unforgettable IDO together! ⏰ #SingSing#IDO#Countdown#GetReady 🎤Announcement | Chat | X (Twitter) | Website | Game

Oʻzbekiston Qilichbozlik Federatsiyasi

@fencinguzbekistan · Post #3966 · 22.05.2025 г., 05:49

⏳ Countdown is on! Only 26 days left until one of Asia’s biggest fencing showdowns! 🌏🤺 📍 Bali – Indonesia 📆 June 17–23, 2025 🏆 Senior Asian Fencing Championship Top athletes are getting ready for an electrifying competition! Stay tuned for full access 📸 and live highlights from the heart of the action 🎥🔥 #Fencing⚔️#Bali2025#AsianChampionship #FCA#FIE#SeniorAsianFencingChampionship2025 #Indonesia#FencingAsia#Countdown

VISION11

@vision11official · Post #1328 · 02.09.2023 г., 06:02

#Power-packed #battle on the pitch.🔥🔥 Are you ready for an India🇮🇳 vs. Pakistan showdown?💪😎 Make you #teams for #AsiaCup contest and win bumper #rewards.⏳️🏌‍♀️ Only on #Vision11, #download now. #india#cricket#asia#asiacup2023#battle#countdown#begin#cricketfans#reward#bonus#vision#vision11