TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 3 слични објави

Пребарај: #kimnamjoon

当前筛选 #kimnamjoon清除筛选
Bts.bighitofficial

@OUR_7_PRINCES · Post #115139 · 07.08.2025 г., 09:40

Harper’s Bazaar korea instagram and twitter update 💜 "When I perform as BTS's RM, I feel most alive standing before my fans with pride and confidence. As Kim Namjoon, Ifeel closer to being my true self when l'm with loved ones, completely open and sincere or when I travel to places where no one recognizes me and dive back into making music." The beginning of RM's new journey, Find more of BTS RM's photos and interview in the September issue of Harper's Bazaar Korea and on our website (harpersbazaar.co.kr). #BottegaVeneta#RM#BTS#KimNamjoon#RMxBottegaVeneta#BazaarKorea #INSTAGRAM | #TWITTER | #UPDATE •@OUR_7_PRINCES•

Bts.bighitofficial

@OUR_7_PRINCES · Post #115140 · 07.08.2025 г., 09:40

Harper’s Bazaar instagram & twitter update 💜 BTS leader, producer and rapper RM's multi-talented charm was captured in the iewfinder of Harper's Bazaar Korea. Discover more in the September print and digital editions of Harper's Bazaar Korea. #BottegaVeneta#RIM#BTS#KimNamjoon#RMxBottegaVeneta#lntrecciato#BazaarKorea #INSTAGRAM | #TWITTER | #UPDATE •@OUR_7_PRINCES•

Harper bazaar korea instagram Update #제작지원#September2025#CoverStory BTS RM의 더 많은 화보와 인터뷰는 <바자> 코리아 9월호와 웹 사이트(harpersbazaar.co.kr)를 통해 만나볼 수 있습니다. @rkive Editor 서동범 Photo 목정욱 Hair 한솜 Makeup 김다름 Stylist 김영진 Set Design 권도형 Artwork Support 유태근 <월송야정(月松夜靜)>, 메타포서울, 모리함 Interview 손안나 Assistant 김진우 Design 한상영 Find more of BTS RM’s photos and interview in the September issue of Harper’s Bazaar Korea, available in print and on our website(harpersbazaar.co.kr). #BottegaVeneta#RM#BTS#KimNamjoon#RMxBottegaVeneta#BazaarKorea -@All_BTS_Updates