TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 6 слични објави

Пребарај: #gantz

当前筛选 #gantz清除筛选
Libertà è ragione

@libertaeragione · Post #4144 · 03.04.2024 г., 17:27

#Israele Benny #Gantz (#BaW|Centro) ha per la prima volta aperto a nuove elezioni: “Per poter mantenere l’unità, il pubblico deve sapere che presto torneremo a chiedere la loro fiducia. Non ignoriamo il 7.10, quindi dobbiamo raggiungere una data elettorale concordata verso settembre. Ho discusso una data elettorale concordata con i leader politici.“ @OsservatorioEsteri

爷青回动画分享频道

@Yeqingjie_GJG666 · Post #1038 · 26.10.2025 г., 03:22

杀戮都市 GANTZ BluRay REMUX ◎年 代: 2004 ◎产 地: 日本 ◎类 别: 剧情 / 科幻 / 惊悚 / 恐怖 / 奇幻 ◎评 分: 7.3 ◎IMDb : tt0434685 ◎语 言: 日语 ◎又 名: ガンツ ◎简 介: 玄野计和加藤胜是小学时代的好友,在一日的偶遇之后,两人为救一只铁轨上的流浪汉而同时命丧黄泉。然而等待着他们的并非虚无,当玄野计睁开眼时,映入他眼帘的居然是一间闻所未闻的高级公寓,他的周围聚集着和他一样迷惘的,互不相识的“死者”们。“你 们的生命已经完结,如何使用你们新的生命,是我的自由”,一个位于房间中央,名叫“GANTZ”的黑色圆球传达了这样的指示。 为了活命,他们被迫的参与了各种各样的与外星怪物之间的残酷战斗,每场战斗结束之后,“死者”们会根据在战斗中的表现而得到相应的分数,利用这些分数,“死者”们可以选择实现愿望或是换取强力武器参加下一场战斗,而分数为0的人们,他们面临的,则是可怕的惩罚.. ◎大 小: 71 G ◎标 签: #杀戮都市#GANTZ#ガンツ#动画#爷青回 115网盘(中字):https://115cdn.com/s/swwvq4w3ffc?password=a430# 访问码:a430 PikPak链接(中字):https://mypikpak.com/s/VOcTWL-mGe0PO0_Qvu0TsLwbo2 密码:xp5a 磁力链接(不含中字):magnet:?xt=urn:btih:500324055d32a26fc8c9ae9635f60c5f82defa63 来自分享者:luxifaer 检索机器人:@yeqing_channel_bot 投稿机器人:@yeqinghuibot 爷青回频道:@yeqingjie_GJG666 爷青结群组:@yeqingjie

Libertà è ragione

@libertaeragione · Post #3998 · 12.10.2023 г., 15:49

#Israele Yair #Lapid (#YA|Centro): “Se pensassi che questo sia un governo di unità nazionale mi unirei, non è troppo tardi per formare il governo giusto. Non ci uniremo perché qui è stata eretta una struttura che non farà altro che aumentare il caos. #Gantz ed #Eisenkot potranno solo dare consigli. #BenGvir rimane ancora a capo del Monte del Tempio e #Smotrich di Hvara. Chiunque abbia causato il fallimento non sarà in grado di risolverlo, i cittadini israeliani possono chiedere di fare la cosa giusta per una volta e sappiamo tutti di cosa si tratta: un governo senza estremisti con un gabinetto piccolo ed efficiente.” @OsservatorioEsteri

Libertà è ragione

@libertaeragione · Post #4000 · 13.10.2023 г., 10:40

#Sondaggi#Israele Sondaggio di Lazar: #NUP (#BaW-#NH)|Centro|Centro-destra: 41 seggi (+12) #Likud|ECR: 19 (-9) #YA|Centro: 15 (-1) #RZ-#OY|Estrema destra ebraica: 9 (-1) #UTJ|Destra charedì: 7 #Shas|Charedì: 7 (-3) #Meretz|S&D: 6 (+2) #Beiteinu|Destra secolarista: 6 #RA|Conservatori islamici: 5 #Hadash-#TA|Sinistra araba: 5 #Balad|Sinistra araba: 0 (1,5%) #Labor|S&D: 0 (1,3%) Data rilevazione: 11-12 ottobre +/-: 4-5 ottobre Intervistati: 512 NUP, la coalizione sionista liberale guidata da Benny #Gantz e Gideon #Saar, raggiunge un nuovo record di seggi (41). @OsservatorioEsteri