TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 4 слични објави

Пребарај: #eurc

当前筛选 #eurc清除筛选
东南亚大事件/头条事件

@pengpaixinwen · Post #29901 · 12.03.2025 г., 12:42

#币圈新闻:迪拜金融服务管理局 (DFSA) 已正式认可稳定币 #USDC 和 #EURC,这标志着数字货币在阿拉伯联合酋长国的采用迈出了重要一步。 这一决定代表着向加密货币融入当地金融行业的重要开放,巩固了迪拜作为全球数字资产创新枢纽之一的地位。 DFSA 批准 USDC 和 EURC 巩固了迪拜作为 数字资产 监管领域的领导者的地位,为投资者和企业创造了一个更安全和可靠的生态系统。 在政府和金融机构的支持下,稳定币正逐渐进入实体经济,并将在该地区的数字支付领域引发革命。 随着金融科技和银行业继续将这些数字货币整合到他们的服务中,我们可以期待区域层面的进一步发展和加密货币的扩展。 这一新的增长阶段可能对全球采用数字资产产生重大影响,使迪拜成为基于区块链的金融市场的中心。 💌投稿爆料:@tyyyy 😀阳光新闻:@yangguang

#币圈新闻:迪拜金融服务管理局 (DFSA) 已正式认可稳定币 #USDC 和 #EURC,这标志着数字货币在阿拉伯联合酋长国的采用迈出了重要一步。 这一决定代表着向加密货币融入当地金融行业的重要开放,巩固了迪拜作为全球数字资产创新枢纽之一的地位。 DFSA 批准 USDC 和 EURC 巩固了迪拜作为 数字资产 监管领域的领导者的地位,为投资者和企业创造了一个更安全和可靠的生态系统。 在政府和金融机构的支持下,稳定币正逐渐进入实体经济,并将在该地区的数字支付领域引发革命。 随着金融科技和银行业继续将这些数字货币整合到他们的服务中,我们可以期待区域层面的进一步发展和加密货币的扩展。 这一新的增长阶段可能对全球采用数字资产产生重大影响,使迪拜成为基于区块链的金融市场的中心。 💌投稿爆料:@tyyyy 😀阳光新闻:@yangguang

Venture Village Wall 🦄

@venturevillagewall · Post #4233 · 24.02.2025 г., 19:00

Circle's Stablecoins Approved in Dubai The DFSA grants formal approval to Circle's stablecoins USDC and EURC as recognized tokens under its crypto regulatory framework, paving the way for their use in digital asset applications within the DIFC. Read more #Circle#USDC#EURC#DFSA#Crypto#Dubai#Regulation#DigitalAssets#Payments#TreasuryManagement

Crypto Headlines

@market_headlines · Post #28128 · 01.04.2026 г., 19:36

#взлом#drift 👇Список активов, украденных у проекта DRIFT. Ущерб оценивается уже в $285m+. ▪#USDC - $71,4m. ▪#JLP - $159,3m. ▪#USDS - $5,3m. ▪#USDT - $5,6m. ▪#JUP - $430k. ▪#USDY - $537k. ▪#zBTC - $591k. ▪#EURC - $678k. ▪#bSOL - $1m. ▪#INF - $2,5m. ▪#mSOL - $2m. ▪#syrupUSDC - $3,3m. ▪#Fartcoin - $4,1m. ▪#WBTC - $4,4m. ▪#JitoSOL - $3,6m. ▪#WETH - $4,7m. ▪#dSOL - $4,5m. ▪#cbBTC - $11,3m. Ранее: - хакер покупает ETH - взлом Crypto Headlines