TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #icn

当前筛选 #icn清除筛选
Host Testing and evaluation

@HostEvaluate · Post #909 · 29.01.2026 г., 15:14

#ISIF#KR#ICN Host Provider: ISIF Cloud (KR.GMP-B.2C4G-COM) Location: Seoul, South Korea Specification: 2vCore(EPYC 7B13) | 4GB RAM | 40GB Disk | 1T @ 200Mbps | $19.2 / Mo 感谢商家提供的测试机,这台是中国大陆优化 MAX 的。机器开通后默认安装的是 alpine,记得重装一下。我连上去没仔细看,输入命令提示 bash not found 给我看懵了。CPU 性能还可以,用的不是老咕噜棒子 U。磁盘的随机读写水平能对齐 SATA SSD,顺序读写的 IO 略高于 SSD。后者应该是有缓存。用来跑计算延迟不敏感的的业务也还可以。商家有提供 DNS 解锁(NF, DAZN, Disney+, Prime, TVB.. 等等常用的都有),报告里面是机器 IP 的结果,其实迪士尼、NF、Prime 也都能看。回程路由,电信走 CN2,联通移动走 CMIN2。商家提供了 /56 的 IPv6 地址,好评。但是三网回程 HE,我们都在用力的绕美。IPv4 国际路由主要靠 gsl,IPv6 能走到一点 ctcsci 的 retn。商家称后续有增加更多上游链路的意向。联通晚上十一点能跑到 150Mbps。 https://hosteval.mntpaji.com/2026/01/29/Blog/isif-kr-bgpb/

Hashtags

Host Testing and evaluation

@HostEvaluate · Post #863 · 08.04.2023 г., 08:40

#Oneprovider#OneCloud#KR#ICN Host Provider: OneCloud Location: Seoul, Republic of Korea Specification: 1vCore | 1GB RAM | 30GB SSD | 1.5TB @ 1Gbps | $8 / Mo Test IP: 223.165.5.1/24 自己试吧 机器性能给人一种大树挂辣椒的感觉。上游 Ehostict 啥都不解锁。三网 SK 延迟很低但我这没速度,估计是 UDP 会被恰,也可能存粹是太挤了。 https://paste.red/p/b7cb8bcc973b