TGTGInsighttelegram intelligenceLIVE / telegram public index

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Hashtags

#libs #tricks #django

Резултати

Пронајдени 141 слични објави

Пребарај: #mix

当前筛选 #mix清除筛选

Wallpapers Arena™🦹🏽‍♀️❤️

@wallpapersarena · Post #3081 · 04.08.2021 г., 14:07

Најди слично Погледај

#Mix@WallpapersArena

Hashtags

#mix

SakuraBangumi

@SakuraBangumi · Post #6332 · 06.05.2023 г., 10:07

Најди слично Погледај

#番剧更新-NC-Baha #MIX：明青故事更新: S2E6.1080P

Hashtags

#番剧更新 #mix

SakuraBangumi

@SakuraBangumi · Post #6198 · 29.04.2023 г., 10:03

Најди слично Погледај

#番剧更新-NC-Baha #MIX：明青故事更新: S2E5.1080P

Hashtags

#番剧更新 #mix

SakuraBangumi

@SakuraBangumi · Post #6048 · 22.04.2023 г., 12:19

Најди слично Погледај

#番剧更新-NC-Baha #MIX：明青故事更新: S2E4.1080P

Hashtags

#番剧更新 #mix

SakuraBangumi

@SakuraBangumi · Post #6047 · 22.04.2023 г., 10:14

Најди слично Погледај

#番剧更新-ANi #MIX：明青故事更新: S2E4.1080P

Hashtags

#番剧更新 #mix

Telegram Premium Emoji | Премиум Эмодзи

@OrderEmoji · Post #181 · 28.06.2024 г., 13:08

Најди слично Погледај

Mix 2.0#mix#emoji 🍏⭐️⭐️⭐️⭐️⭐️⭐️⭐️🔋🥏🌞🚀🥺🛜🤴🛰✅✅✅✅⚽️⭐️🤖➡️⬅️⬆️⬇️📍🤔⏳♾♾✅🔴✔️🎤🌪⏩📱📱📱📱📱⭐️ ➡️Emoji link🔗

Hashtags

#mix #emoji

MF-EMBY 已远去信息安全关注 @airfallen

@misakaf_emby · Post #19134 · 24.09.2023 г., 04:47

Најди слично Погледај

#新番更新 Baha.1080P #MIX：明青故事 S02E24 Channel： @MisakaF_Emby

Hashtags

#新番更新 #mix

机场鉴赏 _(:з)∠)_

@AirportAnalysis · Post #1747 · 04.02.2024 г., 13:23

Најди слично Погледај

#Dlercloud#Mix 官网: https://dlercloud.com/ 频道/群组:均已私有化官方BOT: @DlerCloud_bot （绑定订阅后进入群组）本次测试为官网1888订阅，落地复用较为严重。

Hashtags

#dlercloud #mix

探索号

@seeker_rc · Post #19699 · 05.05.2026 г., 22:25

Најди слично Погледај

豆包也要「付费订阅」了，最高500元/月；宇树机器人在美买票坐飞机，电池被没收；「AI 面试」火爆，但 40% 求职者放弃面试｜极客早知道 ✏ 豆包计划新增付费订阅模式主打生产力场景 5 月 4 日，豆包在 App Store 页面悄然更新了付费版本服务的相关声明。声明称，为更好地服务专业用户，豆包将在保留免费版的基础上，推出包含更多增值服务的付费订阅体系，同时披露了三档定价：标准版 68 元 / 月、加强版 200 元 / 月、专业版 500 元 / 月。据报道，豆包的付费功能将主要专注在复杂任务和生产力场景，如 PPT 生成、数据分析、影视制作等。随着模型能力持续升级，产品已经能满足越来越多的复杂高价值任务。但此类任务需消耗更多算力与推理时间，因此豆包计划上线付费服务，满足好这部分复杂场景需求。至于免费版本，豆包... via 极客公园标签: #AI#机器人#MIX ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道：科技探索者每天推荐有趣内容，欢迎订阅、转发。

Hashtags

#ai #机器人 #mix

Wallpaper Ai download

@downloadaiwallpaper · Post #783 · 20.04.2025 г., 13:17

Најди слично Погледај

#AI#MIX 👉Wallpaper Phone Maximum reaction!❤️ 👇

Hashtags

#ai #mix

Wallpaper Ai download

@downloadaiwallpaper · Post #746 · 17.04.2025 г., 09:56

Најди слично Погледај

#AI#MIX 👉Wallpaper Phone Maximum reaction!❤️ 👇