TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 224 слични објави

Пребарај: #idc

当前筛选 #idc清除筛选

#IDC 日本新产品预售 JPLite VPS: Cogent+HE+EIE 无大陆优化带宽 IPv4+IPv6(SLAAC) 双栈网络 适合落地使用 无法用于国内直连 https://polocloud.gay/index.php?rp=/store/jp-lite-vps JPPro VPS: CN2+10099+CMI+BBTEC NTT+PCCWG+Cogent+HE+EIE 路线仅为目前商定 不排除后续会修改 IPv4+IPv6(SLAAC) 双栈网络 提供个人版套餐 限量 适合直连使用 三网延迟优秀 https://polocloud.gay/index.php?rp=/store/jp-pro-vps 以上两款均为非原生IP,DNS解锁流媒体 对于日区小众流媒体及游戏尽量解锁 但不保证 效果图:https://t.me/polocloud_chat/182696 JPLite 无预计开通时间 JPPro 预计开通时间23年1月 不做保证 预售期间9折循环优惠码:NewLocation-Japan @polocloud_chat 如有疑问欢迎联系 @polocloud_admin

Hashtags

#IDC HKBGP Pro系列新上个人版套餐 三网CMI回程 三网去程优化(CMI/NTT/CN2) 香港原生IP 解锁香港流媒体 等* 附赠YouTube Netflix稳定解锁DNS 可提供iperf3 H5-speedtest测速 * DNS解锁效果图:https://t.me/polocloud_notification/682 另有CMI大带宽商业套餐、HE不限流落地等 https://polocloud.xyz/index.php?rp=/store/hkbgp-pro-p @polocloud_chat

Hashtags

#idc HGC Fixed已经部署升级以及维护完毕! 由本来的1G产品升级到HGC 10G骨干产品 海外访问优秀 国内三网直连 CN2/移动有速度 并且推出HGC Fixed|4C4G|1000M|80T套餐 测试IP:118.140.206.244 (可Iperf3) 活动范围:HGC Fixed全部产品 活动时间: 14/08-24/08 0点整 折扣幅度: 循环9折 参与方式:购买时输入HGC10GUP享受折扣 如有任何问题 可以官网发起工单 访问官网 lightmoon.cloud 了解更多 我们的TG讨论群 @LIGHTMOONGROUP 我们的TG频道 @LIGHTMOONCLOUD

Hashtags

#IDC 香港家宽VDS补货 可自主更换IP 可申请配置NF解锁 HKT / HKBN VDS CPU:8c E5-2680V4 内存:8G ECC DDR4 硬盘:20G NVME SSD IP:1个香港原生动态IP 带宽:HKT打机/HKBN 1000M独享 https://polocloud.xyz/index.php?rp=/store/hk-home-vds @polocloud_chat

Hashtags

#IDC HKBN WTT Fixed 共享带宽 全新回归 港内延迟极低 端口速度充足 原生IP 活动范围:HKBN Fixed 两款产品 使用方式:购买时填写优惠码2022HKBNF 优惠幅度:该两款产品 循环八折优惠 优惠后低至 342元/M 12T、550元/M 35T 活动时间: 2022年6月25日0点整结束 HKBN Fixed测试IP: 116.92.233.1 购买后将会在2H内自动开通 如有任何问题联系 @Lshaonian 购买链接:https://lightmoon.cloud/store/hkbn-fixedvps 访问官网 lightmoon.cloud 了解更多 我们的TG讨论群 @LIGHTMOONGROUP 我们的TG频道 @LIGHTMOONCLOUD

Hashtags

#IDC 美国GTT VPS 火热开卖 精选美国IP 解锁本土流媒体 可工单获取Netflix DNS解锁 不限制流量 请合理使用 最低仅需18元/月 https://miaomiao.moe/index.php?rp=/store/usgtt TG频道:@miaomiaomoe_notice TG群组:@miaomiaomoe

Hashtags

#IDC 美国堪萨斯VPS CPU:1vCPU 内存:512MB/1GB 硬盘:15GB 带宽:1Gbps 流量:1T 双向流量 月付:13.9元 订购:https://kmnix.com/cart.php?a=add&pid=3 ——————————- 解锁Netflix流媒体 不保证大陆速度 ——————————- 3.9元循环优惠码:2E07S5MZSV 8折循环优惠码:S99HSQ6C7E ——————————- 频道:@kmnixchannel 群组:@kmnix

Hashtags

#IDC 活动范围:HGC Fixed 两款产品 使用方式:购买时填写优惠码FazeUP 优惠幅度:该两款产品 循环七折优惠 优惠后低至 208CNY/M 15T、306CNY/M 35T 活动时间:2022年5月24日至2022年5月30日0点整 HGC Fixed测试IP: 210.3.35.1 购买后将会在2H内自动开通 如有任何问题联系 @Lshaonian 购买链接:https://lightmoon.cloud/store/hgcfixed 我们的TG讨论群 @LIGHTMOONGROUP 我们的TG频道 @LIGHTMOONCLOUD

Hashtags

123•••10•••1819
ПретходнаСтраница 1 од 19Следна