TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 1 слични објави

Пребарај: #seko

当前筛选 #seko清除筛选
乌鸦观察

@Bigcrowdev · Post #22521 · 03.03.2022 г., 17:12

#俄罗斯#乌克兰#制裁#物流#货运#快递#供应链#天然气#石油#能源#汽车#飞机#芯片#通信#基站 【欧美对俄启动海运制裁 涉俄商船禁止进港】 因俄乌战事,欧美扩大对俄罗斯制裁。在对俄关闭空域后,‌多国下令禁止与俄相关的船舶和货物进港。因物流链中断,多家头部海运公司已暂停对俄业务。 3月1日,全球前两大集装箱航运公司 #马士基 和 #地中海航运 同时宣布,‌除食品、医疗和人道主义用品外,暂停其他所有进出俄罗斯的货物预订。在此之前,德国 #赫伯罗特、法国 #达飞 轮船和日本 #海洋网联 公司已先后暂停俄罗斯货物的预订服务,以应对全球对俄制裁。 一位船公司人士告诉财新,国际对俄制裁持续扩大,‌这已影响到供应链的完整性。不少国家的货主拒接俄罗斯货物,还有一些国家的港口扣押货物,甚至拒绝装载俄罗斯货物的船舶停靠。而航运业服务全球,装载俄罗斯货物会导致这种全球化服务被物理性中断,为确保业务稳定和安全,只能暂停对俄业务。“另外,俄罗斯银行业务也在受制裁行列,‌这直接限制了航运业务收取或支付款项。” 2月28日,英国交通部宣布俄罗斯控制、运营和租赁的船舶均禁止进入英国港口。荷兰、比利时和德国等国则变更了对俄罗斯相关货物的检查和执行程序,#鹿特丹 港宣布,荷兰海关将直接封锁运往俄罗斯的集装箱。 由于多家航运公司“禁运”俄罗斯货物,‌货代公司同步停止对俄业务。3月2日,全球最大货代公司德迅物流宣布立即暂停接收俄罗斯货物;北美货运巨头 #Seko、#UPS、#联邦快递(#FedEx)也关闭了俄罗斯订单。(财新网)(路透社) 【多家国际能源巨头宣布退出在俄投资】 埃克森美孚、壳牌、BP、道达尔能源、挪威国家石油公司等多家能源巨头表态要陆续退出在俄投资,或不在俄罗斯新增投资。 美国油气巨头 #埃克森美孚 宣布退出在俄油气投资,‌将退出在俄罗斯远东的一个大型油气项目。法国能源巨头 #道达尔能源 则表示将不再为俄罗斯新项目提供资金。挪威国家石油公司宣布退出在俄罗斯的合资企业,‌停止对俄新增投资。BP宣布将出售其所持俄油公司的19.75%股份,BP提名的两名董事也将从俄油公司辞职。(财新网) 【多家车企停止在俄罗斯生产和销售】 据报道,#保时捷 和 #宝马 表示,‌由于缺乏来自乌克兰的零部件,‌将关闭欧洲工厂;#丰田、#奔驰、#现代 则表示将停止在俄罗斯的生产。目前,#‌福特、#雷诺 和宝马已经关闭了俄罗斯工厂。 此外,#沃尔沃、#捷豹路虎、#大众汽车、梅赛德斯-奔驰、丰田、#本田、#宾利、#阿斯顿马丁、#哈雷戴维森、#劳斯莱斯 都暂停了对俄罗斯的销售。金融时报称,原因可能包括制裁、缺乏付款或在一个有可能成为贱民(pariah)的国家经营而带来的声誉损害。 截至3月2日晚间,‌只有现代和日产等少数品牌仍对俄罗斯销售汽车。雷诺控股的Avtovaz仍在销售拉达,‌但雷诺在莫斯科的工厂已关闭,‌同时暂停销售。(金融时报) 【波音和空客暂停向俄航提供零部件和维修支持】 #波音 公司周二表示,已暂停对俄罗斯航空公司的零部件和维修支持,‌并暂停了波音在俄罗斯的业务。最近受欧盟制裁行动影响,#空客 和其他飞机零部件已被禁止出口到俄罗斯,俄罗斯航空公司的航班也被禁止进入欧盟空域。(华尔街日报) 此外,据台媒《经济日报》报道,传台积电、英特尔、AMD 等皆已响应对俄制裁,台积电27日重申,该公司一向遵循法规。(IT之家) 【爱立信和诺基亚停止向俄罗斯供货】 据外媒 Light Reading 消息,#爱立信 和 #诺基亚 本周二(2日)证实,‌他们将在评估西方政府制裁的影响时停止向俄罗斯客户提供产品,该制裁是在俄罗斯总统普京上周下令入侵邻国乌克兰后实施的。LR 表示,这使得俄罗斯运营商只能选择华为。(LightReading) 【耐克暂停在俄线上销售,阿迪达斯终止与俄罗斯足协合作】 #耐克 表示,无法通过线上服务保证向俄罗斯客户交付产品。#阿迪达斯 暂停与俄罗斯足协 (RFU) 的长期合作伙伴关系。(路透社)(彭博社)