Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
#биткоин#SegWit
Что такое SegWit?
К 2017 году недостатки сети биткоина 🥉 такие, как масштабируемость и проблема пластичности транзакций (т.е. изменение части содержимого транзакции, вносящее путаницу в систему учета) становились всё более критичными. На фоне новых проектов и технологий, первая криптовалюта смотрелась дорогой и бесперспективной в технологическом плане развития 📉.
💡 Одним из решений проблемы стал софтфорк биткоина — Segregated Witness (SegWit), который был активирован 24 августа 2017 в блоке 481 824.
🔥SegWit - обновление блокчейна биткоина, направленное на увеличение пропускной способности и решение проблемы пластичности транзакций. Это программное обеспечение позволяет записывать больше транзакции в блок без фактического изменения лимита в 1 Мб.
🔥 SegWit делает безопасной и удобной в проектировании функцию работы сайдчейнов (сетей второго уровня) поверх основной сети биткоина.
✔️ Биткоин, в свое время стал прорывной технологией, но без глобальных улучшений программного обеспечения, каким в свое время стал SegWit не было бы того развития, которое мы видим сегодня.
@MirraChannel😎
#BTC#Legacy#SegWit#Taproot#база
❗️Виды биткоин-адресов: какой выбрать?
Биткоин-адрес — это ключевой элемент для получения и отправки BTC, но не все адреса одинаковы.
С развитием сети появились новые форматы, улучшающие скорость, комиссии и анонимность транзакций. Разбираемся, какой биткоин-адрес лучше выбрать в 2025 году.
📌1. Legacy-адреса (P2PKH) – первый стандарт биткоина
Пример: 1A1zP1eP5QGefi2DMPTfTL5SLmv7DivfNa
Legacy-адреса (или P2PKH – Pay to Public Key Hash) – это оригинальный формат биткоин-адресов, использующийся с 2009 года. Они начинаются с цифры 1.
Преимущества:
✅ Поддерживаются всеми кошельками и биржами.
✅ Простота в использовании.
Недостатки:
❌ Высокие комиссии (из-за больших размеров транзакций).
❌ Не поддерживают современные улучшения, такие как SegWit.
Кому подходит?
Тем, кто использует старые кошельки или хочет совместимость со всеми сервисами.
📌2. SegWit-адреса (P2SH, P2WPKH) – снижение комиссий
Пример:
🔹 P2SH: 3J98t1WpEZ73CNmQviecrnyiWrnqRhWNLy
🔹 P2WPKH (Native SegWit): bc1qw508d6qejxtdg4y5r3zarvaryvaxxpcs
SegWit (Segregated Witness) – это обновление сети Биткоина, введенное в 2017 году для уменьшения размера транзакций и снижения комиссий.
Варианты SegWit-адресов:
P2SH (Pay to Script Hash) – начинаются с 3, обеспечивают совместимость со старыми адресами.
P2WPKH (Native SegWit) – начинаются с bc1q, дают максимальную экономию комиссии.
Преимущества:
✅ Снижение комиссий на 30-40% (за счет меньшего размера транзакции).
✅ Повышенная безопасность (защита от модификации данных).
✅ Поддерживаются большинством современных кошельков и бирж.
Недостатки:
❌ Старые сервисы могут не поддерживать Native SegWit (bc1q-адреса).
Кому подходит?
Тем, кто хочет экономить на комиссиях и использовать современные решения.
📌3. Taproot-адреса (P2TR) – максимальная приватность и эффективность
Пример: bc1p...
Taproot – это последнее крупное обновление биткоина (2021 год), которое значительно улучшает конфиденциальность и снижает комиссии для сложных транзакций.
Преимущества:
✅ Максимальная приватность – транзакции выглядят как обычные платежи, даже если внутри них смарт-контракт.
✅ Оптимизированные комиссии – особенно полезно для мультиподписей и сложных контрактов.
✅ Более гибкие и мощные транзакции.
Недостатки:
❌ Поддерживается не всеми кошельками и биржами.
❌ Пока что используется реже, чем SegWit.
Кому подходит?
Тем, кто хочет максимальной конфиденциальности и использует сложные транзакции (мультиподписи, Lightning Network).
❓Какой биткоин-адрес выбрать в 2025 году?
✔ Legacy (P2PKH, 1...) – если нужна полная совместимость со всеми сервисами, но готов платить высокие комиссии.
✔ SegWit (P2SH, 3... или P2WPKH, bc1q...) – лучший вариант для большинства пользователей: снижает комиссии и поддерживается повсюду.
✔ Taproot (P2TR, bc1p...) – если хочешь максимум конфиденциальности и пользуешься мультиподписями.
Выбирайте биткоин-адрес, соответствующий вашим потребностям, и следите за развитием сети!
👍Подпишитесь на наш канал, чтобы узнавать больше о биткоине и криптовалютах!
___________
@MirraChannel😎