TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 1 слични објави

Пребарај: #clowdbot

当前筛选 #clowdbot清除筛选
折腾实验室频道

@TossLabChannel · Post #961 · 29.01.2026 г., 01:02

#AI#工具推荐#Moltbot#clowdbot 🤖Moltbot:能“真正做事”的开源个人 AI 助手 ㅤ ⭐ 什么是 Moltbot? Moltbot 是一个开源、自托管的个人 AI 助手。由clowdbot团队开发,与普通的问答聊天机器人不同,它是一个能真正“执行任务”的智能代理。它运行在你自己的设备或服务器上,通过 WhatsApp、Telegram、Slack 等常用通讯软件接收指令,并为你处理实际工作。 ㅤ 💡 核心特点 • 执行力强:不仅仅是陪聊,它能自动检查邮件、安排日程、运行脚本、整理文件甚至处理复杂的工作流,且支持后台常驻,无需重复输入上下文。 • 隐私安全:完全自托管,运行在本地环境,数据无需上传至第三方云服务。 • 无缝集成:直接对接你日常使用的聊天工具,指令发送如同聊天一样自然。 • 社区火爆:🔥GitHub Star 数高达 60,000+ 至 80,000+,表明其深受开发者认可,社区活跃度极高。 ㅤ 📝 总结 Moltbot 就像一个“会动手的 AI 助理”,它超越了单纯的信息交互,更像是一个听得懂自然语言的自动化工具。对于重视隐私且希望 AI 能协助处理具体事务的用户来说,这是一个极具价值的开源选择。 🤖懒得部署的直接领取: https://teamoteam.com/t?a=clawdbot 🔘@TossLab🔘@TossLabChannel