Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Понедельник начинаем с танца☺️
Как вам наш новый танцевальный дуэт и творческая коллаборация с Иосифом?
#dance#dancer#trending#танцы#dancetrends#bachata#tiktoktrend#tiktoktrends#танцевальныйтренд#цветтанцакрасный#тренд#danceблогер#danceblogger#танцевальныйдуэт
Пятницу традиционно встречаем с танцами!💃🕺🏼👏
Хороших всем выходных и отличного настроения!❤️❤️❤️
#dance#dancer#trending#танцы#dancetrends#bachata#tiktoktrend#tiktoktrends#танцевальныйтренд#цветтанцакрасный#тренд#danceблогер#danceblogger#танцевальныйдуэт
В следующий раз, когда ты опять решишь, что твое настроение зависит от кого-то, ты вспомни эти слова!🥰
Твое вдохновение, мотивация, настрой, твои эмоции, твои слова - это только ты сам(а). Тебя нельзя обидеть, но ты можешь обидеться сам(а). Тебя нельзя расстроить, это лишь твой выбор расстраиваться или нет. Не подарил цветы, опоздал(а) на встречу, не звонит - это не повод для депрессии, закрываться в комнате, утирая слезы перед телевизором, заедая чем-нибудь вредным. Потрать время на себя, на спорт, книги, прогулки на свежем воздухе, обучение, здоровье, красоту, на подруг/друзей. Порадуйся! Цени своё сбодное время, ведь это дар, недоступный для больше части работающих и гипер занятых людей. ⠀ Не живи ожиданиями. Это - путь в никуда. Не переноси ответственность за свое состояние на своих парня/девушку/мужа/жену/родителей/брата/сестру/детей. Ты - это твое ощущения себя в пространстве. Ты сам(а) выбираешь плакать, корить себя и других или радоваться и улыбаться. Это всегда про твое самоопределение! ⠀
Задай себе вопрос прямо сейчас! А какое настроение я выберу для себя сейчас? А хочу ли я, чтобы мое настроение зависело от кого-то, кроме меня?
Надевай улыбку, танцуй, радуйся и лети в новый изумительный день! Ты его только что выбрал(а)!❤️🫶
#dance#dancer#trending#танцы#dancetrends#tiktoktrend#tiktoktrends#танцевальныйтренд#цветтанцакрасный#тренд#danceблогер#danceblogger#танцевальныйдуэт#счастье
Скоро Новый год? Неее не слышали! У нас в душе лето!😂☀️
#dance#dancer#trending#танцы#dancetrends#tiktoktrend#tiktoktrends#танцевальныйтренд#цветтанцакрасный#тренд#danceблогер#danceblogger#танцевальныйдуэт#выходные#лето#новыйгод
Понедельник - день тяжёлый?😱
Неее. Не слышали!🤪 Улыбаемся и пляшем!💃😉
#dance#dancer#trending#танцы#dancetrends#bachata#tiktoktrend#tiktoktrends#танцевальныйтренд#цветтанцакрасный#тренд#danceблогер#danceblogger#понедельник#понедельникденьхороший
Упс! В конце кому-то было бо-бо!🤭
P.S. Друзья, отличной всем пятницы и прекрасных выходных!😘
#dance#dancer#trending#танцы#dancetrends#bachata#tiktoktrend#tiktoktrends#танцевальныйтренд#цветтанцакрасный#тренд#danceблогер#danceblogger#танцевальныйдуэт#выходные#пяница#непара
С 1 апреля! ☺️❤️
1 апреля - это не только Международный День Смеха, который отмечается во многих странах!😀 А ещё и день рождения 1 канала, любимый телеканал отмечает 30-летний юбилей, с чем я его от души поздравляю!🎉
А ещё 1 апреля 2025 года знаменателем тем, что растущая Луна переходит в знак Близнецов - время ярких идей и легкого общения. Люди становятся более открытыми, любопытными и подвижными. Захочется много общаться, узнавать новое и пробовать необычное. Именно в этот период легко завязываются знакомства и появляются интересные идеи. Кстати, творческим людям стоит поймать волну вдохновения: эксперименты, новые проекты или смелые задумки могут неожиданно принести успех. Также можно заняться поиском новых хобби или записаться на курсы, лекции, мастер-классы и конечно же кто хотел начать танцевать, то это самое подходящее время!
Дорогие друзья, давайте отложим дела и станцуем вместе прямо сейчас!💃🕺🏼🥰
#1апреля#деньсмеха#1канал#dance#dancer#trending#танцы#dancetrends#bachata#tiktoktrend#tiktoktrends#танцевальныйтренд#цветтанцакрасный#тренд#danceблогер#danceblogger#jive#джайв
Когда встретились две подруги: одна нормальная, вторая со странностями🤣
Кто из них них какая, решать Вам!😉
#подруги#прикол#смешноевидео#танцы#dance#хит#тренд#тренды#танцевальныйтренд#dancetrends#tiktoktrend#музыкальныйхит#музыкальныйтрек#певица#звезды#женямалахова
Залетаем с новым трендом под новый хит!🔥
Женя Малахова, бывшая солистка группы “Reflex”, успешно начала сольную карьеру и вырвалась в ТОП-лист со своим треком «Потому что не было тебя»!👏
Со своей стороны я, вдохновившись песней, придумала хореографию под новый трек. Так что танцуем вместе с нами и конечно делимся своими видео!💃💃🫶
#хит#новыйтрек#трек#песня#музыка#тренд#тренды#танцевальныйтренд#dancetrends#tiktoktrend#музыкальныйхит#музыкальныйтрек#певица#звезды#женямалахова#потомучтонебылотебя
Если что, то это не мы растопили 🔥Патриаршие.🤭
Но тренд «Russian Girls» мы просто не смогли пропустить. Как Вам образы?🙃
#патрики#патриаршие#патриаршиепруды#russiangirls#dance#dancer#trending#танцы#dancetrends#tiktoktrend#tiktoktrends#танцевальныйтренд#цветтанцакрасный#тренд#danceблогер#danceblogger#танцевальныйдуэт#выходные#зима#новыйгод
Что может быть тяжелее понедельника? Конечно же первый рабочий день после новогодних праздников!🤪🤭
Но не унываем! Заряжаемся кофе, улыбкой и конечно же танцуем с нами макарену!😉💃🕺🏼
#dance#dancer#trending#танцы#dancetrends#tiktoktrend#tiktoktrends#танцевальныйтренд#цветтанцакрасный#тренд#danceблогер#danceblogger#танцевальныйдуэт#выходные#лето#новыйгод#понедельник#понедельникденьтяжелый#макарена#makarena