TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #lump

当前筛选 #lump清除筛选
小喵的ACG黄油 (重开版)

@xiaomiaogame · Post #2952 · 24.02.2026 г., 08:58

游魂2 タユタマ2 -you’re the only one- 精翻汉化版 从解放了被封印在葦原町的太転依已经过了50年,在其存在表面化之后渡过了短暂的时间。 人们认知了太転依的存在,开始向太転依和人类共存的道路上迈进。对人类来说作为过渡期时代的故事—— 主人公・草壁空所居住的鷹千帆市 矢古民(やこたみ)町在全国来说是一个能够聚集特别优质的神气的地方。 市政府也为“人和太転依共存”注入大量力量,在吸收了很多的人和太転依入住后加速发展起来了。 不过也正因为是矢古民町,才会引发那些事件…… 某一日、空偶然调解了一起人类的孩子和太転依之间的小矛盾。 这件事情本身在矢古民町中并不少见。对于空来说完全意想不到的事件是在这个事情之后没多久。 [终于找到了……那个人一定……是我的……] 头上长着可爱耳朵的女孩子,是太転依变化为人的样子呢,还是从各种各样太転依那里授予加护的人类呢。 将事件从头到尾看完的女孩子,将空带到了祭典太転依的神社・八衢神社。 然后、用闪亮的纯真眼睛看着他后宣言道。 [希望你能当我的丈夫!] 被这个少女——泉戸こはく的真心所吓倒的空。 但在她的母亲・泉戸ましろ的说明下,知道了こはく这个少女为了继承她的志愿实现“太転依和人类共存的社会”而寻找着另一半。 [先、不管当不当丈夫——] 感受到了こはく的热情的空答应入住八衢神社,并且约定为了“人与太転依共存”这一目标而出力。 评分 作者 #方糖社#Lump of Sugar #PC#ADV#精翻 #游魂2#タユタマ2 -you’re the only one- 下载地址

小喵的ACG黄油 (重开版)

@xiaomiaogame · Post #2643 · 09.02.2026 г., 17:43

運命線上のφ 命运线上的φ AI汉化版 漂浮在太平洋上的孤岛,信天岛(しんてんじま)。 少年因缘际会,来到了这座岛上。 根据他自己调查得来的情报,信天岛被称作幻之岛屿,只在超自然的传闻中出现过。 甚至在事实上,它也是不被日本官方承认为领土的架空之岛。 理所当然的,它的掌权者不明,现在有谁住在上面、又过着怎样的生活亦是不明。 信天岛完全笼罩在谜团之中。 少年来到这么个地方的理由只有一个。 而他自己的情况,也包裹在迷团之中。 到达了信天岛的少年,被带到了一个叫做封燐馆(ほうりんかん)的设施处。 馆的庄人及其女仆、以及和自己一样的客人们。 这其中也有和自己同年的人们..而且都是让人眼前一亮的可爱的女孩子。 「梦幻的离岛、用途不明的古怪洋馆、沙滩和泳装、浪漫假日,再加上美少女」 少年锐利的眼神闪烁着, 「原来如此..这肯定会发生事件吧」 转区打开 unmei.exe 运行游戏 claude-3-haiku-20240307 翻译 评分 作者 #Lump of Sugar #PC#ADV#lli#推理#AI汉化 #運命線上のφ#命运线上的φ 入正地址 下载地址