Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Cara @GiorgiaMeloni,
la prima cosa che voglio dirti è questa: non prendertela, non soffrirci, non credere che il tuo dolore sia unico o speciale. La verità è che ci siamo passati tutti.
A chi non è successo di essere mollato? Certo, ghostare è da stronzi, ma cosa ti aspettavi da certa gente?
Si, lo so, si sta male, soprattutto quando in una storia uno ci mette tanto, quando arriva anche a cambiare, a volersi male, ad annullarsi pur di piacere all'altro.
Fa male ed è un po' da merda, però consentimela questa: te l'avevamo detto e provava a fartelo capire anche qualche alleato di governo che di certa gente proprio non ci si può fidare.
Ti sei aggrappata ai sorrisi, alle risate, agli abbracci e alle strette di mano: per un momento lo hai sperato davvero di essere una di loro. Ma quella è gente fatta così, Giorgé, ma l'hai visti in faccia?
Ora restano i ricordi, non rinnegarli perché tutto ci aiuta a essere ciò che siamo, a crescere: consolati con questa frase da baci perugina, che è un po' una mezza cazzata per indorarti la pillola.
T'hanno fregato, lo so, ma ora incazzati e... fagliela pagare: fallo e farai del bene a te stessa, ma pure all'Italia.
Non è che te metti a fa la sottona mo? Quella che guarda gli ultimi accessi su whatsapp?! Devi voltare pagina e, soprattutto, nessuna minestra riscaldata! Mica ci ricaschi? Che quando te chiama ci vai a cena?
Sii forte, borgatara come piaci a noi, che noi italiani siamo tutti un po' borgatari: mannali a fanculo Giorgè, fallo pe te e fallo pe' noi altri.
E se vuoi piangere, na spalla la troverai sempre, ma la prossima volta stacce a sentì.
Ciao Giorgè, avanti tutta.
#Giorgia#GiorgiaMeloni#vonderLeyen#Ursula#UrsulaVonDerLeyen#Commissione#Europa
https://x.com/SavinoBalzano/status/1806017334764544494?t=xN61R2F3b8hHrmCO2gHKsw&s=19
🚨🇪🇺 URSULA VON DER LEYEN HAT EINE BOTSCHAFT AN ÜBER 743 MILLIONEN EUROPÄER ZUR ENERGIEKRISE GESENDET: „Die günstigste Energie ist die, die man nicht verbraucht. Bleibt zu Hause, fahrt nicht mit dem Auto, verbraucht keinen Strom.“
#Europa#ursula#kommission#hormuz#öl
t.me/FGNews07
https://x.com/SavinoBalzano/status/1893964618269167946?t=J228waCh_iC9BSLE8os6Aw&s=19
Con enorme dignità, autorevolissima postura, coraggio e forza, la nostra leader #UrsulaVonDerLeyen conferma la linea dell'#UE: al fianco di #Zelensky, fino alla vittoria finale sulla #Russia di #Putin.
Si cementifica la linea dura e intransigente della #guerra di civiltà: da un lato la #democrazia, la #libertà, la luce; dall'altro il barbaro oscurantismo antidemocratico e illiberale, le tenebre.
Ancora sanzioni, dunque, e il massimo sostegno militare a #Kiev.
Certo, bisognerà organizzarsi: senza gli #StatiUniti lo scenario si potrebbe complicare un tantino, un cicinin, ma nulla potrà mai far crollare l'indefessa volontà della #VonDerLeyen.
Per prima cosa ha deciso di inviare a #VolodymyrZelenskyy il suo servizio da tè: un intero corredo di cucchiaini, forchettine e piccoli coltellini da dolce. Lo sappiamo, non è molto, ma è un inizio: potranno intanto fungere da munizionamento per artiglieria e armi leggere e sostenere l'eroica resistenza partigiana dei guerriglieri della libertà del battaglione #Azov.
Se fosse un gesto isolato servirebbe a poco, ma se tutti in #Europa prendessero esempio da lei allora #VladimirPutin sarebbe semplicemente spacciato.
Grazie #Ursula, ci rendi orgogliosi e il mondo ci osserva con profonda e timorosa ammirazione.
Chissà se #GiorgiaMeloni adesso avrà voglia di smetterla di scimmiottare #Draghi e vorrà dar seguito al mandato elettorale che ha ricevuto. #VonDerLeyen l'ha palesemente fregata: si spera in un minimo di orgoglio, cominciando col prendere le distanze da #Tajani e #ForzaItalia.
La conferma di #Ursula è una vergogna: viene confermata una classe dirigente corrotta e decadente, una delle peggiori di sempre (e ce ne vuole dalle parti di #Bruxelles!).
Il #PD e #Schlein si sbracciano per il #SalarioMinimo e nulla dicono sul fatto che l'avvizzimento delle nostre retribuzioni è direttamente riconducibile alle imposizioni dell'#UE.
I #Verdi di #Bonelli confermano la loro nocività: inquinano (loro si!) il clima politico sostenendo la buffonata del #GreenDeal, mentre votano chi sta contribuendo a dilaniare l'#Ucraina per ingrassare le lobby delle armi americane.
Intanto, mentre personaggetti inutili rincorrono una palla con la storia della raccolta fondi della #partitadelcuore, negli ospedali si consuma la tragedia frutto maligno dei tagli alla sanità, voluti proprio da chi era in campo a ricoprirsi di ridicolo.
Tutte queste osservazioni, al limite dell'ovvio, sarebbero al centro del dibattito pubblico se non avessimo l'informazione che abbiamo: telegiornali, giornali, talk semplicemente patetici e al servizio del racconto dominante. Esiste un problema serio e la democrazia è in pericolo: non per l'arrivo delle destre, dell'#OndaNera o del #Fascismo, bensì per la narrazione che ci viene imposta, con la quale ci ingozzano come fossimo oche da foie gras, impedendo la nostra emancipazione come Paese.
E noi potremmo essere un grande Paese, lo siamo stati.
Ospite di @RadioRadioWeb e di @stemolinaradio
https://x.com/SavinoBalzano/status/1814241338700738960?t=vRN5ZalvaHAlvEwfjAdDlg&s=19
📚📖 Урок финансовой грамотности: кому нельзя давать в долг? Ответ – в нашем ролике!
#Политика#Школа#Трамп#Зеленский#Макрон#Шольц#Урсула#Экономика#Мемы#Геополитика#Юмор#Кредит#Долг#Учитель#Урок#Politics#School#Trump#Zelensky#Macron#Scholz#Ursula#Economy#Memes#Humor#Credit#Teacher#Lesson