TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 14 слични објави

Пребарај: #aio

当前筛选 #aio清除筛选
Crypto Fight || News 🚀

@cryptofightnews · Post #3093 · 13.11.2025 г., 07:02

🆘 ⚠️ ⚠️ ⚠️ ⚠️ ⚠️ 🔔PARTNERSHIP ANNOUNCEMENT 🔺We are thrilled to announce our partnership with #AIO protocol" All the important news will be shared on our Socials! 🔠 🔠 🔠 🔠 🔠 🔠 🔠 🔠 🔠 🔠 🔠 🔽About "AIO protocol " AIO is a decentralized AI interaction protocal which build for bringing in AI into real world. We have built AI deverloper center AI experiences center and our own smart device brand :PixelMug. The super AI that working on AIO is Univoice AI, allowing hunman can communicate with AI and get assistance from it equally and safely. ⏰ Must Join " AIO protocol" Social Media Links : ❌Twitter ✉️Telegram ⏰ Must JoinCrypto Fight Community : ✉️Telegram ✉️Channel 📝Twitter 🔶Binance Live *️⃣Linktree 💥If You Want To Promote Your Project Or AMA Proposal 📞DM @Ryan_Fight

Hashtags

Jobs in USA

@indeed_jobs_usa · Post #1695 · 27.04.2026 г., 12:04

Missed #AIO’s +100% move? We share entries before pumps in Signals Intelligence Club. Join now for calm, clear alerts: Access #ad📢InsideAd

Hashtags

Mexc Dex Spread Tracker Alerts

@mexcdex · Post #23596 · 12.04.2026 г., 18:36

🟢🟢 LONG? #AIO Spread 10.09% detected 💥 Origin: MEXC (DUMP) [M: -10% VS D: -0%] 💎 OLAXBT #AIO_USDT (COPY: AIO) 🌐 Price DEX $0.13030 🎰 Price MEXC $0.11836 ️⚖️ Max Size: 25K $AIO ($3K) 💹️ Funding Rate: 0.0291% 🏦 Market Cap: $30M 💰 Liquidity: $2.3M 💸 Vol DEX/MEXC: $157K / $1.6M ⛓️#BSC Dep: 🟢 (61) W/d: 🟢 0x81a7DA4074b8e0eD51beA40f9dCbDF4d9d4832b4 ⏳Avg Align Time: 35s 📊Avg Spread / Max / Change: ±6% / ±6% / ±2% 📈Win / Draw / Lose: 1 / 0 / 1 💰Total / Week / 24H Profit: -2% / -2% / -2%

Agili

@agili_channel · Post #26 · 13.02.2026 г., 00:46

🤖Cloudflare 官宣:Markdown for Agents (Beta) 原文:Introducing Markdown for Agents Cloudflare 终于把 AI 爬虫当成“一等公民”了! 简单说,就是 CF 现在能根据请求头(Accept: text/markdown),在边缘节点把网页 HTML 自动转成 Markdown 喂给 AI Agent。 划重点: • 省 Token 神器:HTML 转 Markdown 后,Token 消耗能降 80%(官方数据:一篇博客从 1.6w Token 降到 3k)。 • 即开即用:CF 仪表盘点一下开关就行,Pro/Biz/Ent/SaaS 计划目前都免费 Beta。 • 内容协商:不仅是简单的格式转换,还会带上 Content-Signal 头,告诉 Agent 这个内容能不能拿来训练或搜索(基于 Content Signals 框架)。 • 边缘计算:不需要你在源站装插件,CF 直接在 CDN 层面搞定。 Agili 点评: 这简直是独立开发者和 Agent 搭建者的福音!以前写爬虫还要自己搞 HTML cleaning、去广告、转 Markdown,现在 CF 直接把饭喂到嘴边了。 对于内容创作者来说,这也是个把内容“喂”给 AI 的好机会,不用担心 AI 读不懂你的网页结构了。 而且,这也意味着未来的 SEO 可能真的要变成 AIO (AI Optimization) 了 —— 谁的 Markdown 结构更清晰,谁就更容易被 AI 采纳。 以后 curl 记得带上 -H "Accept: text/markdown" 试试!👀 #Cloudflare#AI#Agent#Markdown#AIO

[日常]奇怪的频道

@qgdpd · Post #41 · 23.02.2026 г., 13:49

🤖Cloudflare 官宣:Markdown for Agents (Beta) 原文:Introducing Markdown for Agents Cloudflare 终于把 AI 爬虫当成“一等公民”了! 简单说,就是 CF 现在能根据请求头(Accept: text/markdown),在边缘节点把网页 HTML 自动转成 Markdown 喂给 AI Agent。 划重点: • 省 Token 神器:HTML 转 Markdown 后,Token 消耗能降 80%(官方数据:一篇博客从 1.6w Token 降到 3k)。 • 即开即用:CF 仪表盘点一下开关就行,Pro/Biz/Ent/SaaS 计划目前都免费 Beta。 • 内容协商:不仅是简单的格式转换,还会带上 Content-Signal 头,告诉 Agent 这个内容能不能拿来训练或搜索(基于 Content Signals 框架)。 • 边缘计算:不需要你在源站装插件,CF 直接在 CDN 层面搞定。 Agili 点评: 这简直是独立开发者和 Agent 搭建者的福音!以前写爬虫还要自己搞 HTML cleaning、去广告、转 Markdown,现在 CF 直接把饭喂到嘴边了。 对于内容创作者来说,这也是个把内容“喂”给 AI 的好机会,不用担心 AI 读不懂你的网页结构了。 而且,这也意味着未来的 SEO 可能真的要变成 AIO (AI Optimization) 了 —— 谁的 Markdown 结构更清晰,谁就更容易被 AI 采纳。 以后 curl 记得带上 -H "Accept: text/markdown" 试试!👀 #Cloudflare#AI#Agent#Markdown#AIO

12
ПретходнаСтраница 1 од 2Следна