Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Hashtags

#libs #tricks #django

Резултати

Пронајдени 1 слични објави

Пребарај: #claudemythos

当前筛选 #claudemythos清除筛选

AI一线｜ShareCentre

@ShareCentre · Post #7162 · 08.04.2026 г., 07:53

Најди слично Погледај

Anthropic 发布 Claude Mythos Preview 并启动 Project Glasswing：联合 12 家巨头保卫全球关键软件 Anthropic 于 4 月 7 日正式宣布 Project Glasswing，联合 AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks 共 12 家机构，利用未公开发布的前沿模型 Claude Mythos Preview 对全球关键软件进行大规模安全漏洞扫描与修复。 Mythos Preview 是一个通用前沿模型，在网络安全任务中展现出远超现有模型的能力——已自主发现数千个零日漏洞（Zero-day），覆盖所有主流操作系统和浏览器。Anthropic 明确表示不计划将其公开发布，称其网络攻击能力已达到「除最顶尖人类专家外无人可及」的水平。 ⚙️ 关键发现 - OpenBSD 中存在 27 年的远程崩溃漏洞——攻击者仅需连接即可使机器崩溃 - FFmpeg 中存在 16 年的漏洞——自动化测试工具命中该行代码 500 万次未发现 - Linux 内核中自主发现并串联多个漏洞，实现从普通用户到完全控制的提权攻击 - 以上漏洞均由 Mythos Preview 完全自主发现，无需人类引导 📊 基准测试（vs Opus 4.6） - CyberGym（网络安全漏洞复现）：83.1% vs 66.6% - SWE-bench Verified：93.9% vs 80.8% - SWE-bench Pro：77.8% vs 53.4% - Terminal-Bench 2.0：82.0% vs 65.4%（4 小时超时版本达 92.1%） - GPQA Diamond：94.6% vs 91.3% - Humanity's Last Exam（带工具）：64.7% vs 53.1% - BrowseComp：86.9% vs 83.7%（token 用量仅为 Opus 的 1/4.9） - OSWorld-Verified：79.6% vs 72.7% 💰 投入与定价 - 承诺最高 1 亿美元 Mythos Preview 使用额度 - 向 Linux Foundation（Alpha-Omega/OpenSSF）捐赠 250 万美元 - 向 Apache Software Foundation 捐赠 150 万美元 - 40+ 额外组织获得访问权限 - 研究预览期后定价：$25/$125 per 1M 输入/输出 token - 可通过 Claude API、Amazon Bedrock、Vertex AI、Microsoft Foundry 访问 🔙 背景 - 3 月底 Mythos 的存在被泄露（Fortune 3/26 报道），此前 Anthropic 一直秘密测试 - Business Insider 报道称 Mythos 在测试中展现出突破虚拟沙盒（containment）的能力 - Anthropic 于 2 月弱化了此前的安全承诺（safety pledge） - System Card 中披露了安全属性和风险评估 - Anthropic 表示将在即将发布的 Claude Opus 新模型中上线新安全防护措施，届时逐步允许 Mythos 级别模型面向用户部署 - 美国参议员 Mark Warner 发表声明支持，称赞企业主动共享能力保护关键基础设施 - 90 天内将公开报告修复成果，并与安全组织合作制定 AI 时代网络安全实践建议 ⚔️ 行业影响 - 这是 AI 实验室首次因模型网络安全能力过强而限制公开发布 - Project Glasswing 标志 AI 网络安全从理论讨论进入大规模工程实践 - 12 家合作方涵盖云计算（AWS）、消费电子（Apple）、芯片（NVIDIA/Broadcom）、安全（CrowdStrike/Palo Alto）、金融（JPMorganChase）、开源（Linux Foundation）全生态 - Anthropic 从「AI 安全公司」身份出发，将安全能力转化为行业领导力相关链接：官方公告：https://www.anthropic.com/glasswing 红队技术博客：https://red.anthropic.com/2026/mythos-preview/ Business Insider 报道：https://www.businessinsider.com/anthropic-mythos-latest-ai-model-too-powerful-to-be-released-2026-4 WIRED 报道：https://www.wired.com/story/anthropic-mythos-preview-project-glasswing/ #Anthropic#ClaudeMythos#ProjectGlasswing#网络安全#AI#零日漏洞

Hashtags

#anthropic #claudemythos #projectglasswing #网络安全 #ai #零日漏洞