Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
😄Wow
➖➖➖➖➖➖
🔘Wow is quite informal, and we use it mostly when speaking. The most common use of wow is as an exclamation to express surprise.
🔜Wow! You’ve shaved your beard off!
🔜You looking amazing in that suit! Wow!
🔘Wow can often be a neutral, but pleasane surprise. Intonation is important to express that it is neutral.
🔜Did you make that cake? For me? Wow!
🔜Did you text me to remind me to set my alarm? Wow! Thanks.
🔘Wow can also be used to show wonder or amazement.
🔜Wow! The Moon is so big tonight.
🔜I love the way the light bounces off of the ocean. Wow!
🔘wow can go at the beginning or at the end of the sentence when used as an exclamation.
🔜Wow! That's such a special gift.
🔜I love your new car. Wow!
🔘Wow can be verb which means to make other people feel admiration or excitement or wonder.
🔜She’s an amazing pianist. She wows audiences every time she plays.
🔜He wowed the room with his amazing presentation about gorillas.
#Wow👨🏫@America
➖➖➖➖➖➖➖➖➖➖➖➖
🆕 Crypto News @Money
😁 Crypto Game @Egame
🇺🇸 US News @America
🇯🇵 Japan News @Japan
🇦🇪 UAE News @Dubai
▶️ Popular Movies @Videos
😜 Best Funny Video @Funnys
😄Wow
➖➖➖➖➖➖
🔘Wow is quite informal, and we use it mostly when speaking. The most common use of wow is as an exclamation to express surprise.
🔜Wow! You’ve shaved your beard off!
🔜You looking amazing in that suit! Wow!
🔘Wow can often be a neutral, but pleasane surprise. Intonation is important to express that it is neutral.
🔜Did you make that cake? For me? Wow!
🔜Did you text me to remind me to set my alarm? Wow! Thanks.
🔘Wow can also be used to show wonder or amazement.
🔜Wow! The Moon is so big tonight.
🔜I love the way the light bounces off of the ocean. Wow!
🔘wow can go at the beginning or at the end of the sentence when used as an exclamation.
🔜Wow! That's such a special gift.
🔜I love your new car. Wow!
🔘Wow can be verb which means to make other people feel admiration or excitement or wonder.
🔜She’s an amazing pianist. She wows audiences every time she plays.
🔜He wowed the room with his amazing presentation about gorillas.
#Wow👨🏫@America
➖➖➖➖➖➖➖➖➖➖➖➖
🆕 Crypto News @Money
😁 Crypto Game @Egame
🇺🇸 US News @America
🇯🇵 Japan News @Japan
🇦🇪 UAE News @Dubai
▶️ Popular Movies @Videos
😜 Best Funny Video @Funnys
Это был самый большой кулич: вКрыму испекли 600 килограммовый кулич
Насоздания гигантской сладости ушло пять мешков муки, 10 мешков сахара, тысяча яиц и 15 кг изюма.
JDMax#wow
В аэропорту Гонконга появился огромный рыжий кот прямо посреди терминала. Пушистик выглядит очень реалистично: он двигает ушками, хвостом и даже умеет громко мурлыкать. Встретиться с ним можно будет вплоть до 2 мая.
Жаль забрать домой не получитсь🐈
JDMax#wow
Во «Вкусно - и точка» стартовала коллаба с Роскосмосом
В Кидз Комбо можно найти конструкторы со спутниками, ракетами, астронавтами и прочими кубиками Lego.
JDMax#wow
О вкусном: Кофейня в Тайване подает шелковые круассаны
Десерт сервируется в специальном коконе из сахарных нитей. Сначала булочка крепится на специальный вращающийся механизм, а кондитер поливает ее растопленным сахаром.
дубайскому шоколаду был нанесен сокрушительный удар🥊
JDMax#wow
🦇Настоящая пещера Бэтмена найдена в Камбодже — из нее каждый вечер вылетают миллионы летучих мышей.
Животные могут пролететь до 50 км в поисках добычи. Летучие мыши едят насекомых и спасают от них рисовые поля местных жителей.
JDMax#wow
В Японии выпустили калькулятор, который стоит 50 тысяч рублей.
Лимитированную серию офисных гаджетов представила компания Casio. На создание одного S100X Urushi Edition уходит целый месяц — японские мастера вручную покрывают девайс лаком уруси.
Что-то на роскошном.
JDMax#wow
В Китае есть отель с прозрачным полом
Это комплекс Laojunshan Cliff, и он расположен на отвесной скале на высоте 1600 метров. Из каждого номера открывается вид на горы, которые протягиваются вплоть до горизонта. Есть даже комнаты с двумя стеклянными этажами.
Цены очень демократичные — от 17 тысяч рублей за ночь.
Помечтаем в понедельник 🥰
JDMax#wow
В России продают обручальные сушки
Такой милый подарок выпустили в честь 14 февраля: его нужно вручить второй половинке.
Кто успел, тот и съел
JDMax#wow