TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 6 слични објави

Пребарај: #srbija

当前筛选 #srbija清除筛选
Новости из Сербии

@NewsSerbia · Post #12878 · 18.02.2026 г., 13:01

Премьер-министр Сербии Джуро Мацут сегодня провел переговоры с новым послом Украины в Белграде Александром Литвиненко Глава правительства заявил, что Белград с особым вниманием следит за событиями на территории Украины и сложной гуманитарной ситуацией, касающейся гражданского населения. «Сербия, в пределах своих возможностей, продолжит направлять гуманитарную помощь уязвимому населению в виде финансовых ресурсов, медицинского и электроэнергетического оборудования», – добавил Мацут. Литвиненко поздравил премьер-министра с прошедшим Днём государственности страны и поблагодарил Сербию за все, что она сделала для украинского народа. #Beograd#Srbija#Ukrajina @NewsSerbia

Новости из Сербии

@NewsSerbia · Post #12880 · 18.02.2026 г., 13:40

Для Сербии приемлемо членство в Европейском союзе без права вето, заявил президент Александр Вучич в интервью немецкой газете Frankfurter Allgemeine Zeitung. «Для нас наиболее важным аспектом является внутренний рынок, а также свободное перемещение товаров, людей и капитала. Это те основные ценности, которых мы хотим достичь, вступив в ЕС», – сказал Вучич. Ранее то же самое заявил премьер-министр Албании Эди Рама. Европейский союз уже давно упоминает о возможности такого членства, при котором новые страны ЕС не будут обладать полными правами. #Srbija#Vucic#EU @NewsSerbia

Dragana Trifkovic

@trifkovic · Post #4731 · 18.02.2026 г., 21:43

Для Сербии приемлемо членство в Европейском союзе без права вето, заявил президент Александр Вучич в интервью немецкой газете Frankfurter Allgemeine Zeitung. «Для нас наиболее важным аспектом является внутренний рынок, а также свободное перемещение товаров, людей и капитала. Это те основные ценности, которых мы хотим достичь, вступив в ЕС», – сказал Вучич. Ранее то же самое заявил премьер-министр Албании Эди Рама. Европейский союз уже давно упоминает о возможности такого членства, при котором новые страны ЕС не будут обладать полными правами. #Srbija#Vucic#EU @NewsSerbia

Когда музыка объединяет страны🎶 Под Катюшу танцуют Сербия, Индия и Россия 🇷🇸🇮🇳🇷🇺 Кстати, а Вы знали, что песня «Катюша» переведена на 24 языка?🌍 ⸻ When music unites nations 🎶 People from Serbia, India, and Russia are dancing to Katyusha 🇷🇸🇮🇳🇷🇺 By the way, did you know that this legendary song has been translated into 24 languages? 🌍 ⸻ Када музика уједињује народе 🎶 Под Каћушом играју Србија, Индија и Русија 🇷🇸🇮🇳🇷🇺 Да ли сте знали да је ова легендарна песма преведена на 24 језика? 🌍 ⸻ जब संगीत देशों को एकजुट करता है 🎶 कत्युषा की धुन पर सर्बिया, भारत और रूस के लोग नाच रहे हैं 🇷🇸🇮🇳🇷🇺 क्या आप जानते हैं कि यह प्रसिद्ध गीत 24 भाषाओं में अनुवादित किया गया है? 🌍 #диалогкультур2025#россия#сербия#индия#катюша#мосфильм#80летпобеды#digicultures#russia#serbia#India#Srbija#Rusija

Только живой звук и яркие эмоции!🔥 Захватывающий звук известной во всём мире студии звукозаписи на киностудии «Мосфильм» с уникальной акустикой.🎶 А ещё наше международное творческое русско-сербское трио.💃🚶‍♂️💃 Россия и Сербия — одна семья 🤗 Rusija i Srbija jedna Familija ❤️🙌 #диалогкультур2025#россия#сербия#семья#катюша#мосфильм#80летпобеды#digicultures#russia#family#serbia#Srbija#Rusija#Familija