TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #lass

当前筛选 #lass清除筛选
Galgame分享频道

@xiaomenggalgame · Post #367 · 15.04.2026 г., 10:40

カケオチ/私奔 ▎介绍 “想跟你说点事情。” 用简洁的话语把我叫出去的,是小我一岁的青梅竹马。 “我......明天就要去相亲了。” 我和青梅竹马彼此思念着对方,而我本人只是安身于这种淡淡的甜味,没有更进一步。 这句话,让我为迄今为止两人只保持在暧昧的关系,没有更进一步而感到后悔。 “但是,我,很害怕......” 我现在必须马上下定决心——因为我最喜欢的女孩在我面前哭泣。 所以,我的选择是......? ▎获取 ISO仓库 ▎标签 系统:#ISO 类型:#galgame#NSWF#汉化 出版:#Lass

Galgame分享频道

@xiaomenggalgame · Post #35 · 03.10.2025 г., 06:51

十二神器➏3days—血池轮回 ▎介绍 故事的舞台綾篠市自古作为城下町而一直繁荣。 明治維新后,随着现代化的推进,其纺织工业逐渐兴盛。 由于其地处由山围成的盆地,对周围区域来说,是交通,商贸往来的重要城市。 市中心的綾篠公園是一个自然公园 由篠蔓之池这样一个大块水域围成。 是市民休憩,约会的重要场所, 公园旁边的小山上是男女主人公上学的綾篠学園。 据传说其建校时间为明治31年,有着悠久的历史和传统。 其前身为基督教名门女子私立学校。(怎么咋像旅游景点介绍…) 随着市内人口增加,政府为满足生源需要,故改变其经营模式, 改建为普通公立学校。 其体制也改为男女混合学校。 主人公「高梨 亮」目前住在綾篠公園旁綾篠学園后方的大型住宅区域内。 美丽,和谐的城市生活中,暗藏着不安的阴影: 美少女「柊 美柚」的尸体被发现, 从綾篠学園楼顶上逝去的生命「吾妻 梨花」。 为了结束在这一城市中发生的惨剧,结束这一无休止的噩梦。 故事就这样开始了。(古都旅游介绍总算译完了…) 被红色的落叶以及清新的空气包围着的綾篠市。 在市内的学校上学的高梨 亮以及青梅竹马 藤見 たまき过着平静而快乐的生活。 たまき对自己表明了好感,因为是青梅竹马的缘故,亮迟迟不能决意。 就这样“朋友以上,恋人未满”的关系持续着,突然,街道上发生了怪事。 2人的学校綾篠学園里有名的美少女的尸体被发现了。对这一事件, 学園里的同学们产生了许多的流言,学園里交织着各种不同的推测。 ▎获取 安卓仓库(非直装) 安卓仓库(直装) PC仓库 ▎说明 真实之门文本卡住:将游戏data文件夹内的script.dat文件移动到其它地方(比如桌面),或者删除备份,之后位文本即可正常加载 ▎标签 系统:#安卓#PC#模拟器 类型:#galgame#NSWF#汉化#猎奇#血腥#轮回#NTR#穿越#魔法#战斗#连环杀人 系列:#十二神器#ONS#非直装#直装 出版:#Lass