TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 62 слични објави

Пребарај: #lepen

当前筛选 #lepen清除筛选
Libertà è ragione

@libertaeragione · Post #4357 · 31.03.2025 г., 10:50

#Francia Marine #LePen (#RN|PfE) è stata condannata a quattro anni, di cui due di carcere, disposti sotto forma di detenzione domiciliare elettronica. 100.000 euro di multa e 5 anni di ineleggibilità con esecuzione provvisoria (quindi immediata). Non potrà candidarsi alle elezioni presidenziali del 2027. Le Pen ha lasciato l’aula di tribunale prima di sentire la sua sentenza individuale. @OsservatorioEsteri

Ultimora.net - POLITICS

@ultimoraPOLITICS · Post #39359 · 13.05.2022 г., 17:43

#Francia Marine #LePen (#RN|ID): "Il nostro obbiettivo è eleggere almeno 60 deputati a giugno. Mélenchon ha unito chi difende i Black Bloc, chi vuole disarmare la polizia, chi vuole aprire le porte delle carceri, chi vuole il burkini in piscina e chi vuole 270 miliardi di tasse in più." @UltimoraPolitics

Ultimora.net - POLITICS

@Ultimorapolitics · Post #37470 · 24.04.2022 г., 18:22

#Francia Marine #LePen (#RN|ID): "Nonostante due settimane di metodi ingiusti, brutali e violenti, le idee che rappresentiamo stanno raggiungendo nuove vette. Il risultato è una clamorosa vittoria. Continuerò più che mai il mio impegno per la Francia ei francesi." @UltimoraPolitics

Ultimora.net - POLITICS

@Ultimorapolitics · Post #37230 · 20.04.2022 г., 21:53

#Francia#Presidenziali Marine #LePen (#RN|ID): "Vorrei rivolgermi al popolo francese che, nonostante la fatica e la stanchezza di cinque anni di confronto permanente, deterioramento del proprio tenore di vita, privazione della libertà individuale e collettiva, aspira alla pace, al buon senso nella gestione dello Stato. Auspico il buon senso dei patrioti. Buon senso per impedire ai predatori dall'alto che fanno l'ottimizzazione delle tasse e poi ai predatori dal basso che molestano le brave persone per far loro del male. Il senso comune di privilegiare il radicamento rispetto alla speculazione, il localismo rispetto al globalismo, il valore del lavoro rispetto all'uberizzazione del nostro lavoro, il senso comune di difendere l'anima della Francia. Questo progetto è fattibile, è vitale, è quello che porto per i francesi per tutti i francesi." @UltimoraPolitics

Ultimora.net - POLITICS

@Ultimorapolitics · Post #37226 · 20.04.2022 г., 21:48

#Francia#Presidenziali Marine #LePen (#RN|ID): "Voglio una rinascita democratica con l'attuazione del referendum di iniziativa dei cittadini. C'è bisogno di una revisione costituzionale avvalendosi dell'articolo 11. Il popolo è sovrano, sta a lui direttamente cambiare la Costituzione. Bisogna ricucire la Francia." @UltimoraPolitics

123•••56
ПретходнаСтраница 1 од 6Следна