TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 1 слични објави

Пребарај: #stellarcode

当前筛选 #stellarcode清除筛选
小喵的ACG黄油 (重开版)

@xiaomiaogame · Post #3357 · 11.03.2026 г., 11:05

星辰密文 StellarCode Stellar Code ステラーコード 官方中文版 来自宇宙的不可思议现象、研究人员的离奇死亡、未知物体所输出的神秘暗号。与被公认为“诺贝尔奖有力候选人”的天才妹妹一起,挑战关乎地球命运的谜题。一部融合了科幻与悬疑的文字冒险游戏。 「星辰密文」是由创下累计销量超过30000份的文字冒险游戏「传述之魔女」制作团队——Fragaria所推出的新时代科幻悬疑文字冒险游戏。 「星辰密文」是一款以叙事为核心的文字冒险游戏。 大部分流程将围绕剧情进行展开。 在本作中,您将与登场角色共同面对“超乎想象的谜团”。 其中包含部分需要玩家亲自推理的解谜环节。 请根据所获得的信息,推导出正确的答案。 本作虽为悬疑类作品,但与传统的推理类文字冒险游戏不同, 本作并非是以“找出犯人”或是“解开犯罪手法”为游戏的核心。 您需要解开的谜团与密文,基于宇宙与理论物理种种神秘现象。 即便没有相关的基础知识也无需担心。 解谜的线索将通过阅读游戏剧本自然呈现。 您只需与登场角色一起面对并思考逐步显现的谜团即可。 特别需要说明的是,本作中的解谜部分, 其设计之本意并非是要考验逻辑能力,而是为了加深对剧情的沉浸感。 因此,本作适合喜欢轻度解谜的玩家。 佐藤大地是一名在大学从事人工卫星研究的大四学生。 最近,他多了一个新妹妹。是没有血缘关系的妹妹。 她名叫“瞳”,是美国人,且是被公认为“诺贝尔奖有力候选人”的天才少女。 瞳因某种偶然的契机来到日本。 佐藤屡遭其奚落,心中颇感不满。 直到某天,佐藤在大学的后山发现了一个神秘的圆筒状物体。 那东西正在不断输出奇特的密文。 它是由谁制造的?其制造的目的是什么? 密文的内容又是什么? 出于好奇,佐藤与瞳开始着手调查。 不久,一条神秘的短信发送而来—— 『这是警告。如果瓶子在你那里,绝不能给任何人看』 有神秘组织正悄然盯上圆筒状物体。 即便危机近在咫尺,两人选择义无反顾地踏上解谜之路。 而命运的齿轮,也在此刻悄然转动—— 评分 作者 #Fragaria #PC#ADV#官中#全年龄#Unity#官中 #星辰密文#StellarCode#Stellar Code #ステラーコード 下载地址