TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #londonprotest

当前筛选 #londonprotest清除筛选
Hong Kong Democracy Movement

@hkdmovement · Post #7950 · 16.03.2025 г., 16:28

Around 6,000 people gathered in London on March 15 to protest against China’s plan to build a "super embassy" at Royal Mint Court. The demonstration, organized by Hong Kongers in the UK along with local residents, highlighted deep opposition to this project. Flags supporting movements like "Liberate Hong Kong" and Tibetan independence were seen throughout the crowd. A foreign individual, draped in a Chinese flag and holding provocative slogans, attempted to disrupt the event but was peacefully removed by the police. Protesters emphasized the importance of continuing to focus on political prisoners, including those involved in the "47 activists case." #LondonProtest#SuperEmbassy#HongKong#NoToSuperEmbassy 3月15日,約6000人在倫敦舊皇家鑄幣廠(Royal Mint Court)集會,抗議中國興建「超級大使館」的計劃。這次示威由在英港人組織聯同當地人發起,表達對該項目強烈不滿。現場可見「光復香港」、支持藏人等旗幟,氣氛熱烈。 一名外籍男子披着中國國旗,拿着挑釁性標語試圖干擾集會,最終被警方帶離現場。示威者呼籲社會關注政治犯,包括「47人案」中的在囚人士,繼續支持民主與自由。 #倫敦示威#光復香港#中國大使館重置

Hong Kong Democracy Movement

@hkdmovement · Post #7970 · 20.04.2025 г., 23:11

🚨5月3日倫敦鑄幣廠大遊行 🚨May 3rd Anti-Mega Chinese embassy March Date: 03-05-2025 / 2-5pm Location: Royal Mint Court Format: 遊行& 集會 March & Assembly 齊心協力,見證歷史! 誠邀你再臨倫敦,一同齊集鑄幣廠,以遊行形式抗議反對興建中共超級大使館! 早前傳媒估計政府可能五月作出決定,所以我哋而家更要把握機會向警方施壓,表明現時對附近的風險評估絕不成立,必須重申對倫敦鑄幣廠超級大使館嘅立場。 #NoMegaEmbassy#LondonProtest#NoSuperEmbassy#超級大使館#UK#倫敦#London#英國#鑄幣廠#中國超級大使館#舊皇家鑄幣廠#royalmintcourt