TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 9 слични објави

Пребарај: #pbp

当前筛选 #pbp清除筛选
Ultimora.net - POLITICS

@UltimoraPOlitics · Post #38721 · 07.05.2022 г., 17:14

#Elezioni#RegnoUnito#IrlandaDelNord Seggi assegnati nell'assemblea dell'Irlanda del Nord: #SF|LEFT: 25 #DUP|Destra unionista: 23 #APNI|RE: 17 #UUP|ECR: 10 #SDLP|S&D: 6 Indipendenti unionisti: 2 #TUV|Destra unionista: 1 #PBP|LEFT: 1 Seggi da assegnare: 5 Seggi per posizionamento politico: 🇬🇧 Unionisti: 36 🇮🇪 Riunionisti: 32 🏳️ Neutrali: 17 @UltimoraPolitics

Ultimora.net - POLITICS

@UltimoraPOlitics · Post #38736 · 08.05.2022 г., 00:20

#Elezioni#RegnoUnito#IrlandaDelNord Seggi assegnati nell'assemblea dell'Irlanda del Nord: #SF|LEFT: 27 #DUP|Destra unionista: 25 (-3) #APNI|RE: 17 (+9) #UUP|ECR: 9 (-1) #SDLP|S&D: 8 (-4) Indipendenti unionisti: 2 (+1) #TUV|Destra unionista: 1 #PBP|LEFT: 1 #GreensNI|G/EFA: 0 (-1) Seggi per posizionamento politico: 🇬🇧 Unionisti: 37 🇮🇪 Riunionisti: 36 🏳️ Neutrali: 17 In foto la mappa del voto, realizzata da @ToghannEire. @UltimoraPolitics

Ultimora.net - POLITICS

@Ultimorapolitics · Post #38219 · 03.05.2022 г., 13:22

#Sondaggi#RegnoUnito#IrlandaDelNord Sondaggio di Social Market Research per il Parlamento nordirlandese: #SF|LEFT: 27% #DUP|Destra unionista: 18% (-2) #APNI|RE: 18% (+3) #UUP|ECR: 12% (-2) #SDLP|S&D: 11% (+1) #TUV|Destra unionista: 6% (+1) #GreensNI|G/EFA: 3% (-1) #PBP|LEFT: 2% Data rilevazione: 16-26 aprile +/-: 11-26 marzo Intervistati: 1270 @UltimoraPolitics

Ultimora.net - POLITICS

@Ultimorapolitics · Post #38015 · 29.04.2022 г., 19:23

#Sondaggi#RegnoUnito#IrlandaDelNord Sondaggio di LucidTalk per il Parlamento nordirlandese: #SF|LEFT: 26% #DUP|Destra unionista: 20% (+1) #APNI|RE: 14% (-2) #UUP|ECR: 14% (+1) #SDLP|S&D: 10% (-1) #TUV|Destra unionista: 9% #GreensNI|G/EFA: 3% (+1) #PBP|LEFT: 2% Data rilevazione: 22-24 aprile +/-: 18-21 marzo Intervistati: 1708 @UltimoraPolitics

Libertà è ragione

@libertaeragione · Post #4426 · 25.10.2025 г., 18:30

#Elezioni#Irlanda#Presidenziali Risultati del 1° conteggio: Catherine #Connolly (supp. #SF-#LAB-#SD-#PBP-#S-#GP-#Redress)|LEFT|S&D|G/EFA: 63,36% Heather #Humphreys (#FG|EPP): 29,46% Jim #Gavin (#FF|RE): 7,18% Catherine Connolly eletta nuova Presidente della Repubblica d'Irlanda. In foto, la mappa del voto. @OsservatorioEsteri

Libertà è ragione

@libertaeragione · Post #3832 · 20.05.2023 г., 23:36

#Elezioni#RegnoUnito#Locali#NordIrlanda Risultati definitivi: #SF|LEFT: 144 seggi (+39) #DUP|Destra unionista: 122 #APNI|RE: 67 (+14) #UUP|ECR: 54 (-21) #SDLP|S&D: 39 (-20) Indipendenti: 19 (-5) #TUV|Destra unionista: 9 (+3) #GreensNI|G/EFA: 5 (-3) #PBP|LEFT: 2 (-3) #PUP|Sinistra unionista: 1 (-2) #Aontú|Nazionalisti conservatori: 0 (-1) #CCLA|Sinistra: 0 (-1) Per blocchi: Nazionalisti (#SF-#SDLP-#Aontú): 192 Unionisti (#DUP-#UUP-#TUV-#PUP): 191 Non settari (#APNI-#GreensNI-#PBP): 80 @OsservatorioEsteri