TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 6 слични објави

Пребарај: #singsinggame

当前筛选 #singsinggame清除筛选
SingSing Announcement

@singsingchannel · Post #781 · 06.09.2024 г., 11:50

🤔 Are you ready to run a KTV Empire with SingSing Tycoon Game? 💸 Upgrade your NFTs to add more floors and boost your chain’s potential as well as increase revenue! 🚍 Buses drop off eager customers, ready to belt out tunes! 💸 Collect cash or unlock auto-collect to keep the money flowing! 🎡 Feeling lucky? Spin to win Rarer Karaoke NFTs! 🏗 Expand your karaoke chain and dominate the scene! Ready to be the Karaoke King? 👑 Stay tuned for more! 🎶 #SingSingGame#KaraokeTycoon#NFT#GameFi

SingSing Announcement

@singsingchannel · Post #789 · 10.09.2024 г., 06:35

🎤 Lucky Box Session 2 is dropping soon! 🎉 🪙 Quantity: 200 💰 Price: ✅150 Boxes for All: 800 RUBY each ✅50 Boxes for Pioneer NFT Holders: 400 RUBY each 🗓 Sale Time: 13:00 UTC, Sep 10 🎁What is Lucky Box? Lucky Box is SingSing Exclusive Box allowing you to unbox and receive random KTV NFT or Karaoke Box NFT after new SingSing Tycoon game launching. Read more about KTV NFT or Karaoke Box NFT at: link Don't miss your chance to grab one early! #NFT#Karaoke#SingSingGame#RUBY

SingSing Announcement

@singsingchannel · Post #784 · 08.09.2024 г., 10:01

🎉 3 HOURS TO GO! 🎉 🎁 Lucky Box Session 1 drops soon! ⏳ 🪙 Quantity: 100 💰 Price: 🚨50 Boxes for All: 500 RUBY each 🚨50 Boxes for Pioneer Holders: 400 RUBY each 🗓 Sale Time: 13:00 UTC, Sep 8 Don't miss out on your chance to grab a Lucky Box and unbox an exclusive KTV NFT or Karaoke Box NFT for our upcoming SingSing Tycoon game! 🔗 Read more here: link #NFT#Karaoke#SingSingGame#RUBY

SingSing Announcement

@singsingchannel · Post #783 · 07.09.2024 г., 08:42

🎤 Lucky Box Session 1 will go on sale! 🎉 💰 Price: ✅50 Boxes for All: 500 RUBY each ✅50 Boxes for Pioneer Holders: 400 RUBY each 🗓 Sale Time: 13:00 UTC, Sep 8 🎁What is Lucky Box? Lucky Box is SingSing Exclusive Box allowing you to unbox and receive random KTV NFT or Karaoke Box NFT after new SingSing Tycoon game launching. Read more about KTV NFT or Karaoke Box NFT at: link Don't miss your chance to grab one early! #NFT#Karaoke#SingSingGame#RUBY

SingSing Announcement

@singsingchannel · Post #785 · 08.09.2024 г., 13:00

🎉 LUCKY BOX SESSION 1 IS NOW LIVE! 🎉 🪙 Quantity: 100 💰 Price: 🔸 50 Boxes for All: 500 RUBY each 🔸50 Boxes for Pioneer Holders: 400 RUBY each 🖇Purchase Link: https://t.me/SingSing_TG_bot/app?startapp=_marketplace 🎁 Unlock your chance to unbox a KTV NFT or Karaoke Box NFT for the upcoming SingSing Tycoon game! ⏰ Don't wait—these boxes are limited and going fast! 🔗 Read more here: link #NFT#Karaoke#SingSingGame#RUBY#SaleLiveNow