TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 3 слични објави

Пребарај: #copy

当前筛选 #copy清除筛选
BackWaves.net Announcement

@backwaves · Post #58 · 08.09.2025 г., 15:58

#Maintenance#copy 尊敬的客戶您好, Dear Valued Customer, 您收到此郵件是因為我們將對 LAX 區域服務器 進行下電維護,您的服務將會受到影響。 You are receiving this email because we will be performing a power-down maintenance on the LAX region servers, which will affect your services. 我們將於 香港時間 2025年9月14日 下午2點至下午4點 期間進行維護,約需 10分鐘的斷電升級操作。 The maintenance will take place on September 14, 2025, from 2:00 PM to 4:00 PM HKT, requiring approximately 10 minutes of downtime for upgrades. 對應的 洛杉磯當地時間為 2025年9月13日 晚上11點至 2025年9月14日 凌晨1點。 This corresponds to Los Angeles local time: September 13, 2025, 11:00 PM to September 14, 2025, 1:00 AM. 在此期間,您的服務將不可訪問,請提前做好業務備份與冗餘切換的準備。 During this time, your services will be unavailable. Please ensure proper backups and redundancy measures are in place. 我們對因此帶來的不便深感抱歉,並將在 Telegram 公告頻道 (https://t.me/backwaves) 中跟進維護進展。 We sincerely apologize for the inconvenience and will provide updates on the Telegram channel (https://t.me/backwaves). 郵件將不再另行通知,維護結束後,您的服務器會自動重新啟動。 No further email notification will be sent. After the maintenance, your server will automatically reboot. 如果您在維護結束後遇到任何問題,歡迎隨時通過網站工單聯繫我們,我們將盡快回覆並協助處理。 If you experience any issues after the maintenance, please feel free to contact us via support ticket on our website, and we will respond promptly. 感謝您的理解與支持。 Thank you for your understanding and continued support. Website: BackWaves.net Channel: @BackWaves Group: @BackWavesIdc