TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 1 слични објави

Пребарај: #bindi

当前筛选 #bindi清除筛选
Savino Balzano

@savinobalzano · Post #705 · 18.07.2024 г., 08:45

PD: UN PARTITO COL CORPO DI SCHLEIN E L'ANIMA DI RENZI È dolcissima l'immagine dell'abbraccio tra @ellyesse e @matteorenzi: dolce ed esplicativa di un fatto tanto vero quanto inconfessabile per entrambi. Sono due facce della stessa medaglia. #Schlein è una trovata pubblicitaria, uno specchietto per le allodole, una invenzione di marketing elettorale: un partito ormai elitario aveva bisogno di raccontarsi come forza politica di massa, interessata alle periferie, preoccupata per chi non arriva a fine mese. #EllySchlein ha cominciato a raccontare la storia della rivoluzione che non hanno visto arrivare, del movimento dal basso verso l'alto, del cambiamento radicale che guarda nuovamente a sinistra, ma è tutto un bluff. Diversamente non potrebbe essere perché tutto il marcio che denuncia, tutto lo scatafascio che ci circonda ogni santo giorno è frutto delle scelte (annose) del suo partito. Sono i falchi del #PD a vedere nell'austerità la via (basti pensare alle ultime dichiarazioni di #Gentiloni sulla "cautela nella spesa", come alle storiche dichiarazioni di #Prodi: "con l'euro lavoreremo un giorno in meno e guadagneremo come se lavorassimo un giorno in più"). Sono i falchi del #PartitoDemocratico a credere nella precarietà nel lavoro (la chiamavano flessibilità): il partito è pieno di gente che avrebbe venduto l'anima della zia pur di far passare il #JobsAct, una riforma drammatica che ha cancellato il diritto alla reintegra in caso di licenziamento illegittimo, che ha rimosso il diritto al risarcimento del danno sostituendolo con le indennità (rendendo il licenziamento illecito una banale voce di bilancio), che ha sdoganato il demansionamento rendendolo di fatto più facile che nel periodo corporativo, provando ad allentare ogni limite sul controllo a distanza. La #BuonaScuola chi l'ha votata? Il PD e si tratta di una riforma che insegna lo sfruttamento, che impone ai ragazzi di comprendere che la loro formazione è funzionale alle regole del mercato del lavoro, che oggi è un mercato iniquo, feroce, molto spesso mortale. E di buona scuola qualcuno ci è morto, letteralmente. Chi ha votato queste riforme è ancora nel PD o ne è uscito insieme a #Renzi? Molti non si sono mossi di un centimetro e siedono di fianco a #Elly nelle istituzioni. Il PD lamenta le lunghe liste d'attesa per avere una visita in una struttura pubblica, ma la riforma #Bindi ce la siamo dimenticata? E vogliamo parlare delle decine di miliardi di tagli alla sanità che il partito di Elly ha votato dal 2011 in poi in Parlamento, del sostegno fanatico ai governi tecnici, in primis quello del liquidatore #Monti? Chi sosteneva quelle scelte è uscito dal partito seguendo #Renzi o è rimasto al suo posto e oggi "lotta" con Elly? Indovinate un po'. Vogliamo parlare delle armi e della guerra? Dove sarebbe la differenza? L'unica differenza tra i due consiste in questo: #MatteoRenzi continua ad affermare ciò che ha sempre sostenuto (ovvero un'agenda spiccatamente neoliberale), mentre la seconda fa lo stesso parlando d'altro. A questo servono le sue vuote battaglie arcobaleno: a nascondere la macelleria sociale di cui sono stati e sono responsabili, nel disperato tentativo di drogare l'opinione pubblica. Elly si presenta come il simbolo di un partito pentito, ma ammesso che sia vero (e non lo è) il pentimento fine a se stesso conta zero senza espiazione: ci sono milioni e milioni di persone (di ogni sesso, orientamento sessuale, religione, etnia e così via) che patiscono quotidianamente gli effetti delle scelte del suo partito. Se un transessuale oggi viene licenziato illegittimamente, ammesso che la spunti in tribunale, avrà al massimo diritto a qualche mensilità di indennità e questo per colpa delle riforme pensate, volute e votate da chi ancora oggi popola i banchi parlamentari del Partito Democratico. Ed è solo un esempio: lo stesso si potrebbe dire per molti altri ambiti, a partire dalla sanità, dal trasporto pubblico, dall'istruzione. (...) https://x.com/SavinoBalzano/status/1813857387498856701