TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 16 слични објави

Пребарај: #pterclub

当前筛选 #pterclub清除筛选
PT风向旗

@Ptfxq · Post #972 · 31.12.2025 г., 11:45

#PTerClub#猫站#站点免费#开放邀请 各位猫友,大家好! 辞旧迎新之际,伴随着新一年的到来,我们很高兴地向大家宣布一个好消息——猫站正式迎来七周年! 🎉 在过去的一年中,猫站先后完成了 Tracker 升级 与 域名更换。针对长期以来大家关心的人数上限问题,将会得到解决,自即日起,计划将站点容量扩容 3000 人数上限。受限于邮件服务容量,实际操作中将采取每日增加 200 人上限的方式,直至总人数上限达到 17000 人。 为庆祝猫站成立七周年,并与大家共度元旦佳节,我们特别准备了以下活动: 🎁 七周年庆活动 1. 站免(Freeleech) ⏰ 时间:2026-01-01 00:00 – 2026-01-03 23:59 UTC+8 🎉 全站 Free 三天 Site-wide freeleech is enabled from 01/01/2026 to 01/03/2026 UTC+8. 此外,关于邀请发放,请各位猫友务必注意: 邀请严禁滥发 严禁任何形式的交易邀请、马甲号、共享账号等行为 违规行为将直接影响您的账号安全,并可能波及您本人及所有下家的账号与邀请权限 请大家珍惜来之不易的邀请资格,共同维护良好的站点环境。 最后, 猫站管理组祝各位猫友元旦快乐,新年顺遂! 猫站管理组 敬上

PT风向旗

@Ptfxq · Post #954 · 15.11.2025 г., 12:02

#PTerClub#猫站#关闭邀请 2025.11.15 - 邀请系统暂时关闭。 近期调查发现,相当部分用户通过不正当发放邀请,包括但不限于使用脚本、共享账号等手段。这些行为已严重偏离本站邀请系统的初衷。邀请系统设立的本意,从未将邀请权限视为某种“特权”或“权贵”专属,而是让每位用户能够邀请自己认为合适、值得信任的人进站,共同传递共享与互助的精神。 然而,当前系统已被部分用户滥用。他们通过组建小圈子互相“互送猫粮”以规避邀请冷却时间,或使用脚本、共享账号抢占邀请名额,使邀请权事实上被少数人垄断。更令人担忧的是,部分邀请的发放标准已从“能不能对社区有贡献”变成了“圈内关系好不好”、“是不是自己人”,甚至出现隐形的“邀请交换”。这种现象必然导致邀请质量下降与滥发问题的加剧。 另一方面,这些问题的根源也与站点“扩容”进度密切相关。此前在广大猫友的贡献下,peer 数量已达到约 260 万,服务器负载难以支撑进一步增长(“抢坑”现象即是在全员拥有邀请权限的情况下出现的)。因此,站点必须对 tracker 进行升级改造,以提升系统承载能力。上述不良现象的出现,与 tracker 升级进度缓慢也有客观联系。对此,我们向未参与任何违规行为却受到影响的用户致以歉意。 目前,tracker 改造已进入收尾阶段。预计在扩容完成后,邀请系统将重新开放。在此期间,我们将倒查近期的邀请记录,对违规发放邀请的行为坚决处理。如果你曾使用不正当方式发放邀请,建议尽快私信管理组信箱主动说明情况,以争取从轻处理。

12
ПретходнаСтраница 1 од 2Следна