TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #dittatura

当前筛选 #dittatura清除筛选
Savino Balzano

@savinobalzano · Post #671 · 18.06.2024 г., 15:03

#Resistenza oggi è opporsi a tutto questo, rendersene #liberi. È questo il vero #fascismo: imporre il degrado agli occhi dei nostri figli e raccontarlo come emancipazione. Questa è la vera #dittatura: offuscare le rivendicazioni sociali, nascoste da una bandiera cucita con anomia e squallore. Questa è la vera #violenza: depravazione sponsorizzata dalle multinazionali. Meglio qualsiasi altra cosa.

Savino Balzano

@savinobalzano · Post #896 · 14.02.2025 г., 09:47

https://x.com/SavinoBalzano/status/1890336882346664431?t=76VvEwI_ntFip5o3QAUrzQ&s=19 #Scalfarotto riesce a paragonare il dialogo tra #Trump e #Putin al patto Ribbentrop-Molotov. Si tratta di quello siglato nel '39 tra Hitler e Stalin che, impegnandosi reciprocamente alla non aggressione (e a qualcosa di più, che ancora oggi imbarazza certi sinistri), si spartirono la #Polonia. Per carità, ai paralleli strampalati siamo stati abituati in questi anni di #guerra: ci hanno ripropinato ossessivamente la Conferenza di Monaco del '38, l'#appeasement di Neville #Chamberlain, le citazioni di Winston #Churchill che stanno sempre bene. Tutte puttanate, ma quella di #IvanScalfarotto forse davvero merita il primo premio: #DonaldTrump e #VladimirPutin dialogano per porre fine a una guerra alimentata da progressisti e liberali occidentali e lui li paragona ai due dittatori che diedero il via alla Seconda Guerra Mondiale. Hai vinto Ivan: come possiamo intitolarlo il suo premio? qualche idea? Quelli che hanno soffiato sul fuoco per due anni, parlo in generale, rischiando davvero la deflagrazione di un conflitto totale e nucleare, hanno ancora il coraggio di parlare e di dare sciocche lezioni di storia. Una storia che, se va bene, hanno studiato su La Repubblica. Ciò che abbiamo oggi sotto gli occhi è il risultato della totale assenza di visione degli ultimi anni: dell'ideologia degli scemi che parlavano della guerra di civiltà, dello scontro tra #democrazia e #dittatura, di quello tra #libertà e barbarie. Le ragioni del conflitto sono sempre state altre, decisamente più prosaiche, e oggi lo vediamo nitidamente: dopo aver causato un milione di morti, dopo aver avvelenato un paese (anche con le armi occidentali) che tale resterà per decenni, probabilmente anche di più. È pazzesca la totale assenza di dignità in certi soggetti: l'#UE ancora farnetica di un suo coinvolgimento. Non ci sarà: non conteremo nulla. Ogni volta che qualcuno ha provato a dialogare con Putin è stato coperto di insulti, persino sanzionato. Ha totalmente ragione #Orban: la partecipazione alle trattative devi meritartela e non non ce la meritiamo. Non dopo aver leccato per anni le suole di #Biden. Abbiamo lasciato che fanatiche invasate come #VonDerLeyen e #Kallas guidassero la nostra agenda, a proposito di patriarcato. Hanno farneticato per anni di sconfitta della Russia, di lotta fino alla vittoria finale. Oggi #USA, #Russia e #Cina dialogano senza di noi, anche senza la #NATO (guidata da un altro ciarlatano che immaginava di poter dire la sua dinanzi alla volontà statunitense): arrivano persino a immaginare lo stanziamento delle loro truppe sul territorio ucraino. E ne parlano senza l'#Ucraina! #Zelensky dichiara il suo dispiacere per il mancato coinvolgimento: pare un ragazzino escluso da una festa di compleanno. Una roba deprimente, soprattutto se rimandiamo la memoria alla narrazione della nostra stampa e della nostra televisione che per anni lo ha paragonato a un eroe di guerra. Uno spettacolo oltre il pietoso. Chi vanegga di un coinvolgimento europeo o di #Kiev alla trattativa non si rende conto che quest'ultima è già cominciata, anzi, probabilmente è già finita. Nessuna paura, ce ne accorgeremo presto, noi siamo gli idioti a cui il cameriere consegna il conto alla fine del pasto: prego, si accomodi, la cassa è da quella parte.