Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
According to #Glassnode, a number of long-term holders cut their losses two days ago, sending more than $430 million in Bitcoin to the exchange on January 22.
Recently, short-term and long-term hodlers have stopped taking profits, but switched to cutting losses.
By Crypto Australia
During the chaos of the last few weeks, the #Ethereum market cap briefly fell below the aggregate stablecoin cap, once again.
The Top 4 stablecoins USDT, USDC, BUSD and DAI make up over $138B in total, with the $ETH market cap just 2.8% higher at $142B.
#glassnode
🥸 American spot #Bitcoin#ETFs attracted more than $422 million according to the results of yesterday's trading session — the positive trend continued for 8 consecutive days.
😎 Meanwhile, #Glassnode reported a complete depletion of sellers in #BTC.
Major Altcoin Market Drop: $234B Lost
Glassnode reports a staggering decrease of $234 billion in altcoin market capitalization over the past two weeks. This decline marks one of the largest devaluations in altcoin history, demonstrating a significant disconnect from Bitcoin trends. Many altcoins are facing challenges in gaining adoption and achieving product-market fit. For detailed analysis, visit Wu Blockchain News.
#Altcoin#MarketCrash#Bitcoin#Glassnode#Crypto
#CoinMarketCap#CoinGecko#Glassnode#DuneAnalytics#Messari#DeFi#Web3
5 самых популярных аналитических сервисов для новичков 🚀
Если вы только начинаете 🤓 погружаться в мир криптовалют, то аналитические сервисы — это ваши главные помощники. Они помогают следить за рынком, анализировать данные и принимать решения. Вот 5 самых популярных сервисов, которые точно пригодятся новичкам:
1️⃣. CoinMarketCap - сайт
Назначение: отслеживание цен на криптовалюты.
Основные функции: рейтинг (Топ-100 монет по капитализации), исторические данные и графики изменения цен, информация о криптопроектах.
➡️Как пользоваться: Просто зайдите на сайт, выберите интересующую монету и изучите её графики и информацию.
2️⃣. CoinGecko - сайт
Назначение: анализ рыночных данных и показателей.
Основные функции: метрики проекта (ликвидность, объемы торгов, информация по биржам), графики, сортировка монет по категориям (DeFi, NFT и т.д.).
➡️Как пользоваться: Выбирайте категорию или монету и изучайте её рыночные данные и статистику.
3️⃣. Glassnode - сайт
Назначение: Анализ on-chain данных.
Основные функции: метрики сети (активные адреса, объемы транзакций, хэшрейт), анализ поведения инвесторов.
➡️Как пользоваться: Подпишитесь на бесплатный аккаунт и получите доступ к базовым метрикам, или оформите подписку для расширенного анализа.
4️⃣. Dune Analytics - сайт
Назначение: Анализ данных DeFi-протоколов.
Основные функции: дашборды по DeFi проектам, создание собственных отчетов по нужным параметрам.
➡️Как пользоваться: Зарегистрируйтесь, выберите готовый дашборд или создайте свой.
5️⃣. Messari - сайт
Назначение: Аналитика и исследование криптопроектов.
Основные функции: исследовательские отчеты, подробные данные о каждом проекте, последние новости и инсайды.
➡️Как пользоваться: Изучайте отчеты и анализы, чтобы быть в курсе последних трендов.
Эти сервисы помогут вам лучше понять крипторынок и принимать более взвешенные решения. Начните с базового анализа и постепенно углубляйтесь в детали!
👍 Не забудьте лайкнуть этот пост, если он был полезен!
@MirraChannel😎