TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 4 слични објави

Пребарај: #bcmc

当前筛选 #bcmc清除筛选
AIRDROPS BOSS

@airdropsboss · Post #853 · 28.12.2021 г., 13:42

Dear community! 💙 BCMC1 People IEO Airdrop⬇️⬇️⬇️ @bcmc_peopleIEO_airdropbot ✅ Please complete all the tasks and submit details correctly. 💰 Rewards: - If you complete all tasks you will get 450 BCMC1. 📊Market: CoinMarketCap 💧BOUNTY💧 ⏰ Airdrop will end on (UTC) or when there are 5,000 participants. #BCMC1#BeforeCoinMarketCap#BCMC#Crypto#BCMCToken#Airdrop

AIRDROPS BOSS

@airdropsboss · Post #830 · 15.11.2021 г., 14:59

🚀BeforeCoinMarketCap NEW AIRDROP🚀 💵Total Reward: 550 BCMC1 💰 Value: $8 📊Market: CoinMarketCap click here⤵️ 💎Airdrop Bot💎 ☝️Don't miss out on MLM (Ongoing tokens sale with limited pool). 🥳 Invite buyers with your referral links and earn 10% GOOD LUCK TO EVERYONE!!!✊🏻 💠Telegram 💠Telegram Channel 💠Twitter 💠Facebook 💠LinkedIn 💠YouTube 💠Website #BCMC1#BeforeCoinMarketCap#BCMC#Crypto#BCMCToken#Airdrop

AIRDROPS BOSS

@airdropsboss · Post #854 · 31.12.2021 г., 10:57

💧BeforeCoinMarketCap BOUNTY💧 (For 100 participants only💯) Make a video about our platform: Post it on your official YouTube channel (3-5 minutes) $50 - $100 in BCMC1 token. We take into account the length and quality of the content. Example: Please watch this videos for instructions: https://youtu.be/8t1ucZFnyL8 & https://youtu.be/aYrpgGpI074 1 Best video will receive 15,000BCMC1 ($200) and will posted on our social channels.🏆 Mandatory: ✅Describe the People IEO. (Community voting) ✅Describe the People IEO. (Participant projects) ✅Explain the MLM system (Ongoing token sales) ❗️Notice: The channel must have Minimum of 1000 subscribers. Your email will be blacklisted if you submit an old video link or if you do not follow the instructions given. #BCMC1#BeforeCoinMarketCap#BCMC#Crypto#BCMCToken#bounty#Bounty

AIRDROPS BOSS

@airdropsboss · Post #829 · 13.11.2021 г., 08:32

💎 BeforeCoinMarketCap New BOUNTY 💎 For 100 participants only💯 Bounty Tasks✅ Make a video about our platform: Post it on your official YouTube channel (3-5 minutes) $50 - $100 in BCMC1 token. We take into account the length and quality of the content. 📍Mandatory: 1. Describe the search window. 2. Describe the Announcement window 3. Explain the MLM system (Ongoing token sales): 4. Describe the promotion website Best video will receive 20,000BCMC1 ($300) and will posted on our social channels. 📍Bounty Google Form Notice: The channel must have Minimum of 1000 subscribers. Your email will be blacklisted if you submit an old video link or if you do not follow the instructions given. #BCMC1#BeforeCoinMarketCap#BCMC#Crypto#BCMCToken#Bounty