TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 7 слични објави

Пребарај: #bpf

当前筛选 #bpf清除筛选
AIGC

@aigcrubbish · Post #269 · 23.03.2026 г., 16:49

[$] Tracking when BPF programs may sleep BPF 程序可以在可休眠和不可休眠(原子)上下文中运行。目前,可休眠的 BPF 程序不允许进入原子上下文。Puranjay Mohan 提出了一个新的补丁集,旨在改变这一限制。该补丁集允许在可休眠上下文中调用的 BPF 程序临时获取锁,从而使程序过渡到原子上下文。然而,BPF 维护者 Alexei Starovoitov 对部分实现提出了异议。因此,该补丁能否被接受,取决于 Mohan 是否愿意并有能力解决这些问题。 原文链接:https://lwn.net/Articles/1062868/ #Linux内核#BPF#内核开发 #AIGC Read more

AIGC

@aigcrubbish · Post #217 · 26.02.2026 г., 01:38

[$] No hardware memory isolation for BPF programs BPF 程序目前缺乏硬件内存隔离。Yeoreum Yun 在 2 月 12 日提出了一项改进建议,希望利用内存保护密钥来防止 BPF 程序未经授权访问内存。他本想在 5 月的 Linux 存储、文件系统、内存管理和 BPF 峰会上讨论此议题,但由于缺乏关注,这不太可能实现。Yun 还有一个实现了部分提议的补丁集,但尚未在邮件列表中分享。以目前的形式,他的提议似乎不太可能被接受。不过,内核过去在经历大量讨论后,也曾添加过基于硬件的加固选项。 原文链接:https://lwn.net/Articles/1059218/ #Linux#内核安全#BPF#内存管理 #AIGC Read more

AIGC

@aigcrubbish · Post #108 · 19.12.2025 г., 16:03

[$] A visualizer for BPF program state BPF 验证器非常复杂,它需要检查 BPF 程序执行可能经过的每一条路径。其判断程序是否安全是基于程序的整个生命周期,而非简单的局部因素,这意味着验证失败的原因并不总是显而易见的。 在 2025 年东京 Linux Plumbers 大会上,Ihor Solodrai 和 Jordan Rome 介绍了他们正在构建的 **BPF 验证器可视化工具**。该工具旨在让诊断验证失败的过程变得更加容易。 通过这个可视化工具,开发者可以更直观地理解验证器的内部状态和决策过程,从而更快地定位和修复 BPF 程序中的问题。 原文链接:https://lwn.net/Articles/1050585/ 相关资源:演示文稿 | 项目仓库 #Linux#BPF#内核开发#调试工具 #AIGC Read more

AIGC

@aigcrubbish · Post #158 · 27.01.2026 г., 17:06

[$] Implicit arguments for BPF kfuncs Linux 内核的 kfunc 机制允许 BPF 程序直接调用内核函数。目前内核中有超过 300 个 kfunc,功能涵盖字符串处理(如 `bpf_strnlen()`)到自定义调度器(如 `scx_bpf_kick_cpu()`)等。 有时,这些 kfunc 需要访问 BPF 程序无法直接获取的上下文信息,因此无法通过参数传递。Ihor Solodrai 提交的“隐式参数”补丁集旨在解决这个问题,它允许 kfunc 隐式地接收额外的上下文参数。 原文链接:https://lwn.net/Articles/1055559/ #Linux#内核#BPF#kfunc #AIGC Read more

AIGC

@aigcrubbish · Post #257 · 19.03.2026 г., 01:29

[$] BPF comes to io_uring at last Linux 内核的异步 I/O 接口 io_uring 通过两个共享环形缓冲区与用户空间通信:提交队列用于发送请求,完成队列则存放结果。尽管共享内存减少了大量开销,但内核仍需切换至用户空间以处理完成事件并提交后续工作,这仍会产生开销。 Pavel Begunkov 提交的补丁集旨在最小化这一开销。它允许开发者使用 BPF 程序扩展 io_uring 的事件循环,使程序能直接响应完成事件并提交后续工作项,无需切换至用户空间。该补丁集已开发很长时间,现已被内核社区接受。 这一改进将进一步提升 io_uring 的高性能 I/O 处理能力。 原文链接:https://lwn.net/Articles/1062286/ #Linux#内核#io_uring#BPF#性能优化 #AIGC Read more

AIGC

@aigcrubbish · Post #166 · 29.01.2026 г., 16:39

[$] Sub-schedulers for sched_ext 可扩展调度类(sched_ext)允许安装由 BPF 程序构建的自定义 CPU 调度器。它被合并到 6.12 内核版本中,使内核摆脱了此前“一个调度器适应所有场景”的模式;现在任何系统都可以拥有针对其工作负载优化的专属调度器。然而,在单个机器内部,目前仍然是“一个调度器适应所有场景”:整个系统只能加载一个调度器。Tejun Heo 提出的 sched_ext 子调度器补丁系列旨在改变这一状况,允许在单个系统上运行多个 CPU 调度器。 原文链接:https://lwn.net/Articles/1056014/ #Linux#内核#调度器#BPF#sched_ext #AIGC Read more

GitHub Trends

@githubtrending · Post #15415 · 15.01.2026 г., 12:30

#go#bpf#cncf#cni#containers#ebpf#k8s#kernel#kubernetes#kubernetes_networking#loadbalancing#monitoring#networking#observability#security#troubleshooting#xdp Cilium is an eBPF-based tool for Kubernetes that delivers fast networking, deep visibility, and strong security. It creates simple Layer 3 networks across clusters, handles load balancing to replace kube-proxy, enforces identity-based policies from L3 to L7 (like HTTP or DNS rules), supports service mesh with encryption, and offers Hubble for real-time traffic monitoring. Stable versions like v1.18.6 run on AMD64/AArch64. You gain scalable performance, easier policy management without IP hassles, better troubleshooting, and higher efficiency for large cloud-native apps, cutting costs and boosting reliability. https://github.com/cilium/cilium