@fancam666 · Post #2644 · 21.06.2023 г., 12:01
#LAYSHA - #Goeun [ZOOM IN] By KPOP 性感封面
TGINSIGHT SIMILAR POSTS
Изворен канал @pythonotes · Post #121 · 20 јул.
Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django
Пребарај: #goeun
@fancam666 · Post #2644 · 21.06.2023 г., 12:01
#LAYSHA - #Goeun [ZOOM IN] By KPOP 性感封面
@fancam666 · Post #2599 · 20.06.2023 г., 12:01
레이샤 고은 직캠 #LAYSHA#Goeun PINK LABEL by 220513
@fancam666 · Post #2598 · 20.06.2023 г., 12:01
파티투나잇 레이샤 고은 Party Tonight #LAYSHA#GoEun
@fancam666 · Post #2660 · 21.06.2023 г., 12:02
一刻都无法将视线从你身上移开 #레이샤(#LAYSHA) #고은(#GoEun) 직캠 Opening 4K 60FPS [2019.05.14]
@fancam666 · Post #2659 · 21.06.2023 г., 12:02
一刻都无法将视线从你身上移开 #레이샤(#LAYSHA) #고은(#GoEun) 직캠 Party Tonight 4K 60FPS [2019.05.14]
@fancam666 · Post #2646 · 21.06.2023 г., 12:01
170519 #레이샤(#Laysha) #고은(#Goeun) - 의자 퍼포먼스
@fancam666 · Post #2636 · 21.06.2023 г., 12:01
160519 #레이샤#LAYSHA#고은#Goeun Chocolate Cream
@fancam666 · Post #2602 · 20.06.2023 г., 12:01
#레이샤(#𝐋𝐀𝐘𝐒𝐇𝐀) #고은 (#Goeun) 𝐂𝐡𝐨𝐜𝐨𝐥𝐚𝐭𝐞 𝐂𝐫𝐞𝐚𝐦 [230117] #饭拍 太烧了
@fancam666 · Post #2613 · 20.06.2023 г., 12:01
230609 #레이샤#LAYSHA#고은(#Goeun#金高恩) - (新歌) 붉은꽃 Red Flower
@fancam666 · Post #2608 · 20.06.2023 г., 12:01
#레이샤#LAYSHA#고은(#Goeun#金高银) - 独舞表演 (23.06.09)
@fancam666 · Post #2625 · 20.06.2023 г., 12:02
#한순간도 一刻都无法将视线从你身上移开 (#LAYSHA) #고은(#GoEun) #热舞#饭拍 Chocolate Cream [2019.05.14]