@AirportAnalysis · Post #789 · 18.03.2023 г., 11:32
#creamdata ❏ 机场频道: https://t.me/CreamData ❏ 机场官网: https://www.creamdata.net/ ❏ 机场群组: https://t.me/CreamVPN
Hashtags
TGINSIGHT SIMILAR POSTS
Изворен канал @pythonotes · Post #121 · 20 јул.
Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django
Пребарај: #creamdata
@AirportAnalysis · Post #789 · 18.03.2023 г., 11:32
#creamdata ❏ 机场频道: https://t.me/CreamData ❏ 机场官网: https://www.creamdata.net/ ❏ 机场群组: https://t.me/CreamVPN
Hashtags
@taochanyuantu · Post #29 · 20.07.2022 г., 12:56
#CreamData
Hashtags
@secondcentre · Post #6673 · 25.02.2026 г., 14:32
#二手机场流转计划 机场名: #CreamData 官网: https://www.creampanel.com/ 交易方式: 支付宝口令红包 出售价格: 100RMB 交付方式: 可改邮箱 账户类型: 年付188月,重置600G流量,2027.01.20到期,本月还未使用任何留恋 出售原因: 吃灰机场出售 联系方式: 已隐藏 #已售出 ⚠️ 理性消费,谨慎防诈。
Hashtags
@airportroster · Post #578 · 21.02.2022 г., 07:47
#编号482 #CreamData 收录时间:2022.02.21 官网: https://www.creamdata.net 群组: @CreamVPN 频道: @CreamData 商店截图
Hashtags
@jngchannel · Post #2046 · 12.04.2023 г., 09:38
#CreamData #SSR#SS#Trojan 测速带宽 #北京联通2500M 官网: https://www.creamdata.net 频道: https://t.me/CreamData 群组: https://t.me/CreamVPN 套餐截图: https://t.me/taochanyuantu/29 也是一家广告很多的机场,经常在Facebook这类软件看到这家机场的广告 入口:两组镇江BGP 落地:Linode、Amazon、Kddi、Vultr、Kirino、DigitalOcean、Scloud、Misaka等
@jngchannel · Post #901 · 03.10.2022 г., 12:38
#CreamData #SSR#SS#Trojan 测速带宽 #深圳电信2000M 官网: https://www.creamdata.net 频道: https://t.me/CreamData 群组: https://t.me/CreamVPN 套餐截图: https://t.me/taochanyuantu/29 这次晚高峰测速表现比之前好多了,但是Netflix解锁掉的有点多......感觉背后的解锁商应该是佩奇集团,这锅甜妈得背 有一元试用
@jngchannel · Post #642 · 06.09.2022 г., 09:53
#CreamData #SSR#SS#Trojan 测速带宽 #安徽电信1000M 官网: https://www.creamdata.net 频道: https://t.me/CreamData 群组: https://t.me/CreamVPN 套餐截图: https://t.me/taochanyuantu/29 有一元试用
@jngchannel · Post #220 · 01.08.2022 г., 13:05
#CreamData #SSR#SS#Trojan 测速带宽 #安徽电信1000M 官网: https://www.creamdata.net 频道: https://t.me/CreamData 群组: https://t.me/CreamVPN 套餐截图: https://t.me/taochanyuantu/29 有一元试用
@jngchannel · Post #1698 · 27.01.2023 г., 07:41
#CreamData #SSR#SS#Trojan 测速带宽 #四川联通1500M 官网: https://www.creamdata.net 频道: https://t.me/CreamData 群组: https://t.me/CreamVPN 套餐截图: https://t.me/taochanyuantu/29 也是一家广告很多的机场,经常在Facebook这类软件看到这家机场的广告,上次测还是在去年10月份了,之前的价格设置的很不好,这次终于改了,这家也是多线程倍率,除非你嫌流量多,不然别没事测速 入口:深圳移动、镇江BGP 落地:Linode、Amazon、Kddi、Vultr、Kirino、DigitalOcean、Scloud、Misaka等
@gfw250 · Post #43 · 06.03.2022 г., 05:37
#creamdata #校园网100M #山东联通500M #四川电信300M #佛山电信1000M 频道:@CreamData 群组:https://t.me/CreamVPN 官网:creamdata.net
@jngchannel · Post #2341 · 13.07.2023 г., 06:26
#CreamData #SSR#SS#Trojan 测速带宽 #新疆移动1000M #广州电信4000M 官网: https://www.creamdata.net 频道: https://t.me/CreamData 群组: https://t.me/CreamVPN 套餐截图: https://t.me/taochanyuantu/29 也是一家广告很多的机场,经常在Facebook这类软件看到这家机场的广告 入口:镇江BGP、上海移动 落地:Linode、Amazon、Kddi、Vultr、Kirino、DigitalOcean、Misaka等
@jngchannel · Post #950 · 08.10.2022 г., 09:37
#CreamData #SSR#SS#Trojan #沪港专线#沪日专线 测速带宽 #北京联通2500M #河南移动3000M 官网: https://www.creamdata.net 频道: https://t.me/CreamData 群组: https://t.me/CreamVPN 套餐截图: https://t.me/taochanyuantu/29 还算不错的一家机场,就是价格设置挺尴尬的 有一元试用,允许两个公网ip在线 有点生🌿,后面几个流量测没了 等会儿抽一份年付