TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 11 слични објави

Пребарај: #aac

当前筛选 #aac清除筛选

名称:寻雪迷踪 (2026) 持续更新 4K WEB-DL H265 AAC 最新更新 #寻雪迷踪@yunruo 描述:骗子网红的巫术占卜,招来一起离奇绑架案。二十四小时之内,阴谋层层包裹着的是一个个不能告人的秘密,错综复杂的三组人物关系,在前后24个小时之内将一个阴谋从看似平静的水面之下一个个翻出,美女网红,黑市绑匪,钱庄老板粉墨登场,在忙于奔命或救命的路上,各显其能,丑态百出。 #悬疑#寻雪迷踪#4K#WEBDL#AAC

115网盘资源分享频道

@lsp115 · Post #17379 · 18.04.2026 г., 21:35

🎥香水 (2006) ⭐️评分:7.4 🏷类型:犯罪 / 奇幻 / 剧情 👥主演:本·卫肖 / 艾伦·瑞克曼 / 蕾切儿·哈伍德 / 达斯汀·霍夫曼 / 约翰·赫特 🔖 标签: #香水#电影#ed2k#4K#AAC 🤖 投稿:@tpbox_bot 🔍 搜索:@sougou115 ✈️ 机场:红杏云 | 糖果云 📺 公费服:蘑菇Emby媒体库

115网盘资源分享频道

@lsp115 · Post #17818 · 29.04.2026 г., 22:07

🎥飞驰人生3 (2026) ⭐️评分:7.1 🏷类型:剧情 / 喜剧 👥主演:沈腾 / 尹正 / 黄景瑜 / 张本煜 / 魏翔 🔖 标签: #飞驰人生3#电影#1080P#AAC#WEB-DL 🤖 投稿:@tpbox_bot 🔍 搜索:@sougou115 ✈️ 机场:红杏云 | 糖果云 📺 公费服:蘑菇Emby媒体库

115网盘资源分享频道

@lsp115 · Post #17721 · 27.04.2026 г., 00:29

📺八千里路云和月 (2026) 📂收录版本:八千里路云和月 (完结) ⭐️评分:5.0 🏷类型:剧情 / War & Politics 👥主演:王阳 / 万茜 / 黄澄澄 / 于和伟 / 毕彦君 🔖 标签: #八千里路云和月#剧集#AAC#HEVC#SDR 🤖 投稿:@tpbox_bot 🔍 搜索:@sougou115 ✈️ 机场:红杏云 | 糖果云 📺 公费服:蘑菇Emby媒体库

115网盘资源分享频道

@lsp115 · Post #17524 · 25.04.2026 г., 02:19

📺八千里路云和月 (2026) 📂收录版本:八千里路云和月 (完结) ⭐️评分:9.0 🏷类型:剧情 / War & Politics 👥主演:王阳 / 万茜 / 黄澄澄 / 于和伟 / 毕彦君 🔖 标签: #八千里路云和月#剧集#4K#AAC#HEVC#SDR 🤖 投稿:@tpbox_bot 🔍 搜索:@sougou115 ✈️ 机场:红杏云 | 糖果云 📺 公费服:蘑菇Emby媒体库

115网盘资源分享频道

@lsp115 · Post #17471 · 24.04.2026 г., 11:44

📺我存在的时间 (2014) 📂收录版本:我存在的时间 Boku no Ita JikanThe Hours of My Life S01 1080i JPN Blu-ray AVC LPCM 2.0-HDAsia ⭐️评分:7.8 🏷类型:剧情 / 家庭 👥主演:三浦春马 / 多部未华子 / 斋藤工 / 风间俊介 / 山本美月 🔖 标签: #我存在的时间#剧集#1080P#AAC#BluRay#日语 🤖 投稿:@tpbox_bot 🔍 搜索:@sougou115 ✈️ 机场:红杏云 | 糖果云 📺 公费服:蘑菇Emby媒体库

115网盘资源分享频道

@lsp115 · Post #18166 · 05.05.2026 г., 00:15

📺金关 (2026) 📂收录版本:金关 HDR (完结) ⭐️评分:0.0 🏷类型:悬疑 / 犯罪 👥主演:经超 / 黄尧 / 屠芷莹 / 杨凯程 / 孙仲秋 🔖 标签: #金关#剧集#4K#AAC#HDR10#HEVC 🤖 投稿:@tpbox_bot 🔍 搜索:@sougou115 ✈️ 机场:红杏云 | 糖果云 📺 公费服:蘑菇Emby媒体库

115网盘资源分享频道

@lsp115 · Post #18387 · 13.05.2026 г., 14:48

📺雨霖铃 (2026) 📂收录版本:雨霖铃 (1-3) ⭐️评分:9.0 🏷类型:剧情 👥主演:杨洋 / 章若楠 / 方逸伦 / 张予曦 / 修庆 🔖 标签: #雨霖铃#剧集#10bit#4K#AAC#HDR10#HEVC#高码 🤖 投稿:@tpbox_bot 🔍 搜索:@sougou115 ✈️ 机场:红杏云 | 糖果云 📺 公费服:蘑菇Emby媒体库

GitHub Trends

@githubtrending · Post #15585 · 26.03.2026 г., 11:30

#python#4k#aac#apple_music#apple_music_downloader#downloader#m4a#m4v Gamdl is a free command-line tool to download Apple Music songs in high-quality AAC 256kbps, music videos up to 4K, albums, playlists, and artist content, with synced lyrics (LRC/SRT), rich metadata, and cover art. Install via `pip install gamdl`, add your browser cookies from an active subscription, and run `gamdl [URL]`. It benefits you by letting you enjoy offline playback anywhere without streaming data costs, on any device, with organized files ready for your library. https://github.com/glomatico/gamdl