@cubicyyy · Post #2036 · 28.08.2024 г., 12:32
#cpp
Hashtags
TGINSIGHT SIMILAR POSTS
Изворен канал @pythonotes · Post #121 · 20 јул.
Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django
Пребарај: #cpp
@cubicyyy · Post #2036 · 28.08.2024 г., 12:32
#cpp
Hashtags
@NekoMirra · Post #1589 · 16.01.2026 г., 19:17
现代C++开发环境配置指南 一篇较为完善的Vscode 现代C++开发环境配置指南 文章完整覆盖了 C++开发环境配置的全链路: 编辑器辅助 → 编译与构建 → 包管理 → 调试与优化 → 安全检查 → 性能分析 → 运行与发布。 它既介绍了工具(clangd、clang-format、clang-tidy、CMake、vcpkg、Valgrind 等),也给出了配置方法和常见命令示例 #cpp
Hashtags
@awesomeopensource · Post #126 · 30.04.2018 г., 05:00
Anbox 可以在 GNU/Linux 下运行 Android 软件(不是虚拟机 而是一种 chroot ,Anbox 使用当前 Linux 的 Kernel 所以基本上没有性能损失 语言:#cpp 分类:#Linux#Android 感谢 @wmliyin 的投稿
@tonorbital · Post #367 · 15.07.2024 г., 11:33
🚀 BOOM UP Successfully Concludes IDO on #TonUP! 📅 Claim Your $BOOM Tokens: Date: July 15th Time: 03:00 AM UTC 💙 Exciting News! $BOOM will be listed on Bitget, a leading global cryptocurrency exchange, fulfilling their #CPP commitment. 🔵 Initial Listing Details: Trading Pair: BOOM/USDT Deposit: Now Open Trading Starts: July 15 at 12:00 PM UTC 🤔 What is TonUP?
@awesomeopensource · Post #141 · 21.07.2018 г., 03:18
Collabora Online 将 LibreOffice 移植到浏览器上,具有Office几乎所有功能,支持协作编辑等功能。 Tags:#office Languages:#cpp
@awesomeopensource · Post #137 · 23.05.2018 г., 12:38
Qt Material Design Desktop Widgets Qt material design 组件库。 分类:#qt 语言:#cpp 感谢 @iVanilla 的投稿
@awesomeopensource · Post #123 · 27.04.2018 г., 11:15
qtkeychain qtkeychain 可以根据环境自动选择最安全的方法保存密码和其他加密信息。 分类:#qt 语言:#cpp
@awesomeopensource · Post #122 · 27.04.2018 г., 11:15
QtAutoUpdater Qt app自动更新框架,支持三大平台。 分类:#qt 语言:#cpp 感谢 @iVanilla 的投稿
@thedevs · Post #1420 · 07.03.2019 г., 16:52
Announcing the open sourcing of Windows Calculator. #article#windows#cpp#tools @thedevs https://kutt.it/ctks8K
@NekoMirra · Post #1577 · 07.01.2026 г., 17:32
Vscode快速配置Clangd+Cmake开发环境 https://cevolve05.github.io/post/2025/07/15/config-devenv-cpp-vscode/ √此帖得到了原作者的巡回检视(x #cpp#clangd
@awesomeopensource · Post #95 · 02.04.2018 г., 05:08
Logstalgia Logstalgia是一种网站流量可视化工具,可以根据服务器日志将频繁的请求演示为一条壮观的瀑布。 语言:#cpp 分类:#可视化#3d 感谢 @unnamed5719 的投稿
@awesomeopensource · Post #94 · 02.04.2018 г., 05:08
Gource 用于git等版本控制的3D可视化工具,每个分支每个贡献者每个更改将项目的发展过程动画演绎出来 非常壮观。 语言:#cpp 分类:#可视化#3d 感谢 @unnamed5719 的投稿