TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 19 слични објави

Пребарај: #linkcube

当前筛选 #linkcube清除筛选

#二手机场流转计划 机场名: #LinkCube 官网: https://linkcube.org/clientarea.php?action=productdetails&id=26586 交易方式: 支付宝口令红包 出售价格: 10 交付方式: @lkjhhhs 账户类型: 邮箱 出售原因: 垃圾不好用 联系方式: 已隐藏 #已售出 ⚠️ 理性消费,谨慎防诈。

#Linkcube#BGP CNBJ–AWS #SS#SSR https://linkcube.co 机场简介: 原MonoCloud与便利店合并后的新站,低调稳定的老牌机场。 机场线路: 电信,移动,AZure,HKT,NTT(支持Surge,Clash托管) 机场套餐: 仅提供年付套餐,按限速区分套餐等级。 用户福利: 普拉斯影业- Linkcube 特供 Emby 流媒体服务。前30位结算用户,优惠码【10%OFF】 终身9折。

杰尼龟和他的订阅们

@jngchannel · Post #1925 · 09.03.2023 г., 13:00

#LinkCube #Trojan 测速带宽 #镇江电信2000M 官网: https://linkcubesub.xyz 频道: https://t.me/linkcube_service 群组: 频道关联群组 套餐截图: https://t.me/taochanyuantu/129 比较低调的一家机场,没怎么看到过测速,最近从温州移动入口更换成广州电信入口,不过速度并没下降,同时又进行了全解锁 入口:广州电信 落地:Kirino、Miku、Oracle、Misaka等

#Linkcube#专线 #Trojan 测速带宽: #广西移动2000M 官网: https://www.linkcube.org 频道: @linkcube_service 机场配置: 深圳电信113段⚡/深圳移动📱/深圳联通🪢三网智能接入;江苏镇江BGP;上海移动📱 这家也是TG上开了很多年很低调的一家一线机场,可以看到带宽口子很足直接顶满了,流媒体解锁也很到位也有家宽IP,价格也是非常亲民哈15元/月100G起感觉性价比非常高!PS:测速仅供参考,测速流量疑似劫持

小众机场测评

@sstrojan · Post #677 · 12.11.2025 г., 03:16

#Linkcube#专线 #Trojan 测速带宽: #广西移动2000M 官网: https://clashmaomi.com/linkcube 频道: @linkcube_service 机场配置: 深圳电信113段⚡/深圳移动📱/深圳联通🪢三网智能接入;江苏镇江BGP;上海移动📱 这家也是TG上开了很多年很低调的一家一线机场,可以看到带宽口子很足直接顶满了,流媒体解锁也很到位也有家宽IP,价格也是非常亲民哈哈15元/月100G起感觉性价比非常高!PS:测速仅供参考,测速流量疑似被机场劫持

小众机场测评

@sstrojan · Post #786 · 26.11.2025 г., 06:30

#Linkcube#专线 #Trojan 测速带宽: #上海Azure10G 官网: https://www.linkcube.org 频道: @linkcube_service 机场配置: 深圳电信113段⚡/深圳移动📱/深圳联通🪢三网智能接入;江苏镇江BGP;上海移动📱 这家也是TG上开了很多年很低调的一家一线机场,去除劫持后也可以看到真实速度大概是多少,流媒体解锁也很到位也有家宽IP,价格也是非常亲民哈15元/月100G起感觉性价比非常高!

#Linkcube#专线 #Trojan 测速带宽: #上海Azure 官网: https://www.linkcube.org 频道: @linkcube_service 机场配置: 深圳电信113段⚡/深圳移动📱/深圳联通🪢三网智能接入;江苏镇江BGP;上海移动📱 这家也是TG上开了很多年很低调的一家一线机场,去除劫持后也可以看到真实速度大概是多少,流媒体解锁也很到位也有家宽IP,价格也是非常亲民哈15元/月100G起感觉性价比非常高!

12
ПретходнаСтраница 1 од 2Следна