TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #g10

当前筛选 #g10清除筛选
Fed. Russian Insiders ®

@FedRussianInsidersVip4Free · Post #7127 · 18.03.2026 г., 05:22

📍 SIGNAL ID: #G10 COIN: $TRX/USDT Direction: ⬆️ LONG Type: Swing -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- Position Size: 2-4% Leverage: 3-5x -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- ENTRY: 0.3041 - 0.3045 🎯 Target 1: 0.3061 🎯 Target 2: 0.3074 🎯 Target 3: 0.3094 🎯 Target 4: 0.3119 🎯 Target 5: 0.3160 🚫 STOP LOSS: 0.3016 Daily and 4H charts confirm bullish structure with EMA ribbon aligned and MACD crossing bullish, momentum increasing as expected. Breakout confirmed by volume supports sustained upside movement. Entry between 0.3041-0.3045, key support to hold at 0.3016. -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- Yours truly, Fed. Russian Insiders® • Sent via TeleFeed

Hashtags

VIVIYU小世界

@viviyuTW · Post #82 · 21.04.2020 г., 04:00

@VIVIYU小世界 [桃園美食]MU Curry.暮|藝文特區裡G10 GO ! 市集對面新開咖哩專賣店‧咖哩愛好著的新去處 家中小朋友最近迷上咖哩飯,在網路上看到新開『暮咖哩』,沒想到在藝文特區裡出現咖哩專賣店,這週末找個晚餐時間前往嘗鮮,位置就在G10 GO ! 市集對面,大膽顏色的外觀整個超明顯,在馬路對面就有停車場超方便,主要販售單人定食套餐,除了內含咖哩醬與主餐外,還有配上溏心蛋、飲品與味噌湯,內容豐富趕緊來品嚐吧! https://www.viviyu.com/archives/31346 #G10 GO #MU Curry #mucurry #中正藝文特區 #咖哩 #咖哩專賣店 #咖哩店 #咖哩週 #暮 #暮咖哩 #桃園咖哩 #桃園美食 #桃園藝文中心 #桃園藝文廣場 #菜單