Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Внимание! Киберспорт! 🫶
Green Plum Sauce "The E-Sports Circle’s Toxic Assembly Camp" / «Собрание злокачественной опухоли киберспорта»
187 глав + 7 экстр
Тренер х Капитан команды
Суперстратег Линь Янь каким-то образом попадает в новеллу о киберспорте за год до того, как разворачивается основной сюжет. Пользуясь случаем, он основывает собственный клуб и собирает в него еще никому неизвестные бриллианты. Но первая же встреча с капитаном, которого нужно завербовать, проходит… необычно)))
Читать на английском
Читать на русском
Обложки тайские
#новеллы#CAMP
#активности#CAMP
Проявляем активность в новом модульном блокчейне второго уровня, который использует данные из социальных платформ, под названием Camp Network.
Проект привлёк более $29m от: 1kx(lead), Blockchain Capital(lead), OKX Ventures, Hypersphere и др. при крайней оценке FDV $250m.
Что делать:
1. Запрашиваем тестовые токены в кране
2. Переходим на сайт и выполняем социальные задания
3. Выполняем квесты здесь;
4. Минтим NFT здесь по мере их появления;
5. Делаем деплой смарт-контракта на Onchaingm
6. Взаимодействуем с экосистемными проектами здесь
Финансовые затраты:
0$
Australie: vous vous souvenez des photos des camps de quarantaine que je vous avais montrées?
La première ministre du Queensland admet face caméra que les #camp de #quarantaine qu'ils ont construits seront, entre autres, pour les non-vaccinés. (la vidéo est coupée où elle mentionnait aussi les "retours de voyage") https://twitter.com/HeleneSutter/status/1451347706002223111
🏕 I tried several trends with my groupmates at the camp, including this frozen people video:)
☺️ Huge thanks for the best video editor of the Yale family -> @notjustadiary
✍️ Feel free to share your thoughts and comments; will be sharing memorable moments in upcoming days!
Stay tuned (hard)! #ibrat#camp
Дорогие подписчики,
Вы уже заметили, как часто на канале появляются материалы с базы ✈️ TRAINING?
Хотите посетить базу и провести на ней 2 недели в настоящей авиационной атмосфере и научиться новым навыкам среди профессионалов?
Тогда у меня для вас хорошие новости 🔥
Специально для Лёгкого неба, летная школа Авиатор предоставляет скидку
5 000 рублей для наших подписчиков по промокоду LEGKOENEBO⚡️
Что вас ждет в лагере:
⏺ Изучение управления дроном или совершенствование своих навыков
⏺ 2 недели на ухоженной территории среди хвойных лесов
⏺ Поход на 2 дня с настоящими приключениями
⏺ Дружный коллектив и общение с единомышленниками
И многое другое
Звучит здорово? Приглашаю вас и ваших друзей в лагерь!
Для подробностей и записи переходите в бота: @Aviator_Legkoenebo_camp_bot
Количество мест ограничено
Лёгкое небо | Донат
#aviation#camp#Авиатор#S7TRAINING
Дорогие подписчики,
Вы уже заметили, как часто на канале появляются материалы с базы ✈️ TRAINING?
Хотите посетить базу и провести на ней 2 недели в настоящей авиационной атмосфере и научиться новым навыкам среди профессионалов?
Тогда у меня для вас хорошие новости 🔥
Специально для Лёгкого неба, летная школа Авиатор предоставляет скидку
5 000 рублей для наших подписчиков по промокоду LEGKOENEBO⚡️
Что вас ждет в лагере:
⏺ Изучение управления дроном или совершенствование своих навыков
⏺ 2 недели на ухоженной территории среди хвойных лесов
⏺ Поход на 2 дня с настоящими приключениями
⏺ Дружный коллектив и общение с единомышленниками
И многое другое
Звучит здорово? Приглашаю вас и ваших друзей в лагерь!
Для подробностей и записи переходите в бота: @Aviator_Legkoenebo_camp_bot
Количество мест ограничено
Лёгкое небо | Донат
#aviation#camp#Авиатор#S7TRAINING