@levit_world · Post #1706 · 24.10.2024 г., 10:11
#Noob-Saibot_style
Hashtags
TGINSIGHT SIMILAR POSTS
Изворен канал @pythonotes · Post #121 · 20 јул.
Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django
Пребарај: #noob
@levit_world · Post #1706 · 24.10.2024 г., 10:11
#Noob-Saibot_style
Hashtags
@PensivePost · Post #4837 · 28.01.2021 г., 09:14
A heart that flickers, a tear that glimmers and an ink that spills. It's really not that deep, you're just too shallow. #review#noob#poetry
@PensivePost · Post #5170 · 06.05.2021 г., 06:10
I knew a girl who liked to draw, Pictures for only her eyes. She was more artistic late at night. Her drawings were different, No paper, No pen. But she needed a bandage, And wore long sleeves twenty-four/seven. We stood by the river, Under the stars, When she rolled up her sleeves And showed me her scars. She felt embarrassed and stared at her shoe. Then I rolled up my sleeves and whispered, "I draw too." #review#yourreview#noob
Hashtags
@PensivePost · Post #4753 · 17.01.2021 г., 14:31
Honesty for one, behold my love. I'll come in your dreams, For every night that I'm gone. Honesty for one, Behold my Love. #review#noob#prose Author's note: This might not make sense because: There's a song that I only remember by the deep voice of the singer, the melody and the vague-not-so-understood lyrics. These are the words that match that voice and my feelings. And obviously not the exact lyrics.
@PensivePost · Post #4749 · 17.01.2021 г., 05:13
Faith is a big word, Trust is what you can promise. And betrayal is what you fulfill. #review#noob#prose
@PensivePost · Post #5159 · 01.05.2021 г., 16:22
It came from something we can't even see, It took so many lives and gave us the malady, The death, the pain, the anger the disability, Old people say they never witnessed such calamity. With heavy heart, Hope is alive and this is the fact, May the God help us to face all of this, Some people are still doing something wrong, Hope they'll get the fruits of their Unholy act. #anon #noob #review
@PensivePost · Post #5158 · 01.05.2021 г., 16:21
It came from something we can't even see, It took so many lives and gave us the malady, The death, the pain, the anger the disability, Old people say they never witnessed such calamity. With heavy heart, Hope is high, will is strong and this is the fact, May the God help us to face all of this, Some people are still doing something wrong, Hope they'll get the fruits of their Unholy act. #anon #noob #review
@PensivePost · Post #5157 · 01.05.2021 г., 16:20
It came from something we can't even see, It took so many lives and gave us the malady, The death, the pain, the anger the disability, Old people say they never witnessed such calamity. With heave heart, Hope is high, will is strong and this is the fact, May the God help us to face all of this, Some people are still doing something wrong, Hope they'll get the fruits of their Unholy act. #anon #noob #review
@elfcryptovip · Post #12659 · 11.05.2026 г., 10:34
📍 List of abbreviations commonly used in cryptocurrency trading: #ALTCOIN = Alternate cryptocurrency except bitcoin #SHITCOIN = A coin with no potential value or use #BEAR | #BEARISH = Negative price movement #BULL | #BULLISH = Positive price movement #LONG = Margin buy position #SHORT = Margin sell position #BTFD = Buy The Fucking Dip #DILDO = Long green or red candles 😆 #DYOR = Do Your Own Research #FA = Fundamental Analysis #TA = Technical Analysis #FOMO = Fear Of Missing Out #JOMO = Joy Of Missing Out #FUD = Fear Uncertainty & Doubt #HODL = Hold a position #MCAP = Market Capitalization #MOON = Continuous upward movement of price #OTC = Over The Counter #PUMP = Upward price movement #DUMP = To sell off a coin #REKT = When you have a bad loss #WHALE = Very wealthy trader/Market mover #AMA = Ask me anything #ATH = All Time High #ATL = All Time Low #DLT = Distributed ledger technology #IMO = In My Opinion #LAMBO = Lambo is symbol that becomes an elusive goal for most investors #NOOB = A person who is inexperienced #SAFU = Secure Asset Funds for Users #SHILL = Holder of altcoin who just wants to promote it for his own benefit ✅@ElfCryptoVIP