TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 3 слични објави

Пребарај: #dlt

当前筛选 #dlt清除筛选

🚨Delta this is an ALPHA Guys. Came across this project, looking very bullish and I would ape a bag due to the utilities on offer. Market is rough, and this one stands out. Take a look at $DLT Delta #DLT, a US-based project headquartered and registered as a taxpayer in Chicago, Illinois, is a pioneer in Layer 3 development with a huge future. It's not just a push; it's a holding company project with advanced development. Progressive marketing will begin with at least 100 Kols (FROM TODAY) 🛡- Supply of only 40 🛡- 0% tax rate 🛡- The team has no tokens 🛡- Liquidity locked 🛡- Future burn of 50% of the total supply. 🛡- Twitter (X) Gold verification (Doxxed) CA. 0x780b8bfe62a2De66a0Eea806BeeE15cB86E2EA70 📉Chart: https://www.dexview.com/bsc/0x4106993E91bc2ABEaf40F56cf3B6a49b2FB194B8 📈Buy here: https://pancakeswap.finance/swap?chain=bsc&inputCurrency=0x55d398326f99059fF775485246999027B3197955&outputCurrency=0x4106993E91bc2ABEaf40F56cf3B6a49b2FB194B8&chainOut=bsc ⭐️ ⭐️ ⭐️ Website | Whitepaper | Telegram | X | Audit | Token snifer | Docs Company Register EEUU |

Hashtags

Venture Village Wall 🦄

@venturevillagewall · Post #4254 · 26.02.2025 г., 19:00

Gotbit Founder Extradited to Face Charges The founder of cryptocurrency financial services firm Gotbit has been extradited to the U.S. to face charges of market manipulation and conspiracy to commit fraud. More details available in the official announcement from the Department of Justice here. #Crypto#Gotbit#Fraud#MarketManipulation#SEC#Bitcoin#DeFi#NFT#Coinbase#Phantom#SimpleHash#MORPHO#Ethereum#Binance#WhaleAlert#Regulation#Justice#ICO#DLT#AI

Elf Crypto VIP

@elfcryptovip · Post #12659 · 11.05.2026 г., 10:34

📍 List of abbreviations commonly used in cryptocurrency trading: #ALTCOIN = Alternate cryptocurrency except bitcoin #SHITCOIN = A coin with no potential value or use #BEAR | #BEARISH = Negative price movement #BULL | #BULLISH = Positive price movement #LONG = Margin buy position #SHORT = Margin sell position #BTFD = Buy The Fucking Dip #DILDO = Long green or red candles 😆 #DYOR = Do Your Own Research #FA = Fundamental Analysis #TA = Technical Analysis #FOMO = Fear Of Missing Out #JOMO = Joy Of Missing Out #FUD = Fear Uncertainty & Doubt #HODL = Hold a position #MCAP = Market Capitalization #MOON = Continuous upward movement of price #OTC = Over The Counter #PUMP = Upward price movement #DUMP = To sell off a coin #REKT = When you have a bad loss #WHALE = Very wealthy trader/Market mover #AMA = Ask me anything #ATH = All Time High #ATL = All Time Low #DLT = Distributed ledger technology #IMO = In My Opinion #LAMBO = Lambo is symbol that becomes an elusive goal for most investors #NOOB = A person who is inexperienced #SAFU = Secure Asset Funds for Users #SHILL = Holder of altcoin who just wants to promote it for his own benefit ✅@ElfCryptoVIP