TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 5 слични објави

Пребарај: #oine

当前筛选 #oine清除筛选
平价机场收录

@jichangenen · Post #293 · 22.04.2023 г., 06:25

#oine 又改回来了,而且便宜了 oine买的订阅:http://v2.oine.top/api/v1/client/subscribe?token=f5183e9e9d07df693f3d4220a5953c20 机场

Hashtags

平价机场收录

@jichangenen · Post #126 · 16.03.2023 г., 14:22

#oine#机场 速嫖之。群组开禁言,预定下月跑😔 找到合作商了,群组禁言解除,价格也不是0了 不想注册、注册不了可以嫖我的 Q 本来就是靠量大,不知道这样还有啥优势 机场

Hashtags

平价机场收录

@jichangenen · Post #71 · 09.03.2023 г., 13:27

#oine#白嫖#机场 oine 3G/月,限速50,能无限续费 机场修好了,原付费订阅用户可提供付费截图或订单号发工单、邮件以及Telegra获得免费订阅 本人已续两次,值得购买 需要邮箱验证 🎟优惠劵 oine 月付 邀请有效人数达到3个及以上,可获得除佣金外7折专属折扣(永久7折优惠),可以和优惠券叠加使用 🍟套餐 10/月/5T;5/月/2T;0/月/3T 机场 · 群组

平价机场收录

@jichangenen · Post #22 · 03.03.2023 г., 15:26

#oine#机场#流量包 oine 用优惠码可以用9块多买10T的,都是1倍率。 10T一个月用到月末,我是20G 无年付,节点没全红过,好用 需要邮箱验证 微信、支付宝 好了 机场 · 群组

平价机场收录

@jichangenen · Post #96 · 12.03.2023 г., 11:11

已收录机场 我还是分开发比较好。 欢迎投稿 群组 · 搬运的代理软件下载地址 · #通知 · #收录 #免费机场alwaysfree #三毛机场 #996程序员倾情打造 #FCCloud #云图极速sofun #白嫖机场 #acfun #阿狸云 #一乐 #Virtual S Private Network #oine #袋鼠加速器 #大牛机场 #Coral Moss #虾米云 #Proxyvip #CLOUD『爬牆雲』 #Rspeed #全球上网 #Free✈️ #Ensoleillé #LL #EMO #青森Cyanmori #BAKAPIE #五元店 #极速云 #付费机场 #夜猫云☁️ #XUEQIU #DiffAuto® #Targoo Cloud #小白云 #菠萝男孩渡海而来 #Faston #可可云 #维尼云 #十元店 #V2Link VPN #EFCloud #风车机场 #一分机场 #Tencent云 #新生机场 #雨燕云 #时代互联-小熊α #凌云网络 #暗影VPN #慈善机场 #梯子 #Freeplus #PIniaCloud #不将就机场 #三分机场 #幻神节点服务 #亏本机场 #福利机场 #赔钱机场 #Linki #Hneko #Misaka Airport #23区空港 #Bayria #特价机场 #JJCloud-高速高端稳定 #性价比机场 #深度漫游 #魔法云 #米丝云 #外面看看网络加速 #果酱Cloud #穿云 #JetStream VPN #牛逼机场 #免费机场 #ELK CLOUD #MAX全球加速 #弱智云