TGTGInsighttelegram intelligenceLIVE / telegram public index

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Hashtags

#libs #tricks #django

Резултати

Пронајдени 9 слични објави

Пребарај: #xml

当前筛选 #xml清除筛选

help florin закрыт

@HELPFLORIN · Post #6490 · 20.02.2023 г., 00:43

Најди слично Погледај

𖥻 🍵 ›› ֗ . . ✦ › › xml by @korolevalalin ➫ 𝘁𝗮𝗴𝘀 — #xml (ⲃ ⲕⲟⲙⲙ.)) `` взяⲗυ ♡゙ — ‹ + › ⲃ ⲕⲟⲙⲙ.

Hashtags

#xml

help florin закрыт

@HELPFLORIN · Post #6291 · 06.02.2023 г., 22:01

Најди слично Погледај

𖥻 🍵 ›› ֗ . . ✦ › › xml by @korolevalalin ➫ 𝘁𝗮𝗴𝘀 — #xml (ⲃ ⲕⲟⲙⲙ.)) `` взяⲗυ ♡゙ — ‹ + › ⲃ ⲕⲟⲙⲙ.

Hashtags

#xml

help florin закрыт

@HELPFLORIN · Post #8651 · 26.07.2023 г., 05:58

Најди слично Погледај

#lini › › alight motion cc 𝗍𝖺𝗀𝗌 — #xml `` взяли « + » в коmm.

Hashtags

#lini #xml

ALL About RSS

@AboutRss · Post #776 · 21.08.2020 г., 07:30

Најди слично Погледај

#教程「Building a web scraping tool with Python」 6月发出第一篇的信息爬取系列教程终于在八月完结，其中第一篇讲如何用 #Python 解析 #XML 格式的 RSS feed。总共有三篇： 1️⃣Building an RSS feed scraper with Python 2️⃣Automated web scraping with Python and Celery 3️⃣Making a web scraping application with Python, Celery, and Django https://codeburst.io/building-an-rss-feed-scraper-with-python-73715ca06e1f 发现于 https://twitter.com/RSSCircus/status/1271810732225593346 题图来自 DataCamp。

Hashtags

#教程 #python #xml

Oneplus 13 Updates

@OnePlus13Series · Post #369 · 15.01.2026 г., 09:19

Најди слично Погледај

LM.CCD config adapted for OnePlus 13 ⬇️ Download Gcam App (pick aweme variant) What's Working : Main, Telephoto, Selfie, UW, Night Sight, Portrait, Videography (4k 60fps + Stabilization) Changelogs : • Based on LM.CCD_v3_Sabre config by LaoMa • Upscaling is enabled by default for Selfie Camera • Removed extra profiles (which i felt useless) • Miscellaneous small tweaks done by me. XML (.agc) Save Directory: /Download/AGC 9.2/configs All credit goes to the original creator of the config. #gcam#xml#agc 👤 Adapted by: @pulkittg 🔔 Updates: @OnePlus13Series 💬 Discussion: @OnePlus13SeriesChatRoom

Hashtags

#gcam #xml #agc

djangoproject

@djangoproject · Post #547 · 14.01.2018 г., 21:44

Најди слично Погледај

https://stackoverflow.com/questions/3224268/python-unicode-encode-error Python #Unicode#Encode Error I'm reading and parsing an Amazon #XML file and while the XML file shows a ' , when I try to print it I get the following error:

Hashtags

#unicode #encode #xml

djangoproject

@djangoproject · Post #382 · 12.07.2017 г., 21:20

Најди слично Погледај

https://wiki.python.org/moin/PyQt #PyQt is one of the two most popular Python bindings for the #Qt cross-platform #GUI/#XML/#SQL#C++ framework (another binding is #PySide).

Hashtags

#pyqt #qt #gui #xml #sql #c #pyside

djangoproject

@djangoproject · Post #408 · 10.08.2017 г., 10:42

Најди слично Погледај

https://docs.python.org/3/library/xmlrpc.html #XML-#RPC is a #Remote_Procedure_Call method that uses XML passed via #HTTP as a transport. With it, a #client can call methods with parameters on a remote server (the #server is named by a URI) and get back structured data. #xmlrpc is a package that collects server and client modules implementing XML-RPC. The modules are: xmlrpc.client xmlrpc.server

Hashtags

#xml #rpc #remote_procedure_call #http #client #server #xmlrpc

djangoproject

@djangoproject · Post #551 · 23.01.2018 г., 16:28

Најди слично Погледај

http://lxml.de/ #lxml is the most feature-rich and easy-to-use library for processing #XML and #HTML in the Python language. The lxml XML toolkit is a Pythonic binding for the #C libraries #libxml2 and #libxslt. It is unique in that it combines the speed and XML feature completeness of these libraries with the simplicity of a native Python #API, mostly compatible but superior to the well-known ElementTree API. The latest release works with all #CPython versions from 2.6 to 3.6. See the introduction for more information about background and goals of the lxml project. Some common questions are answered in the FAQ.

Hashtags

#lxml #xml #html #c #libxml2 #libxslt #api #cpython