Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Завтрак утром, бар вечером? В Питере другие правила...
⠀
Наша студия реализовала уникальный проект для нового ресторана в центре Санкт-Петербурга.
⠀
Prosa Breakfast Bar – атмосферное место напротив Спаса на Крови, где вы можете окунуться в атмосферу викторианского стиля, созданного Андреем и КсениейКарельскими.
⠀
🪟 Разработанный нами логотип повторяет формы оконных рам и обрамления картин, подчеркивая детали интерьера.
⠀
В рамках проекта был создан уникальный паттерн, отсылающий к интерьерам европейской культуры, где зачастую можно увидеть живые деревья во дворах уютных ресторанов.
⠀
Все это органично отобразилось на всех носителях, таких как: меню, стаканы, стикеры или даже барная стойка.
⠀
Рекомендуем к посещению!
📍 Санкт-Петербург, наб. канала Грибоедова, 5
#lupo#lupodesign
Надо бы ребрендинг сделать. Но и сайт тогда придётся обновлять.
Ребята из Eleon справились с первой задачей, а мы помогли реализовать вторую.
Одностраничный сайт производителя со всем необходимым функционалом уже вышел в свет. Удобный и яркий – что ещё нужно для современного бренда?
На сайте можно ознакомиться со всей подробной информацией: список вкусов и их описание, позиционирование бренда, контакты и прочее.
+600к к продажам обеспечено!
#lupo#lupodesign
🎸 По настоящему роковой логотип.
Сотворили умопомрачительное лого для Трёхи, блогера в кальянной индустрии, который ведёт популярный YouTube-канал Rock Love Hookah.
Дима один из немногих тру поклонников данного жанра музыки, поэтому логотип напрямую отражает его любовь к этой культуре.
⠀
Буква «ё», в красном цвете, под видом всеми известного жеста идеально вписалась в нашу идею с использованием медиатора вокруг лого.
Логотип сразу же начал использоваться не только в онлайн жизни, но и в офлайн. Например, они изготовили крутой мерч совместно с компанией Tongs Wear.
⠀
#lupo#lupodesign
🧁 Приготовили действительно вкусное лого!
Разработали логотип для кондитерской в Казани La Retta
Нежный, сливочный, аппетитный логотип с сахарными палочками, чтобы вот совсем сладко было.
Логотип ужа вовсю используется в реальной жизни (если ты ещё не выпал из неё, как мы).
Визитки, наклейки, воздушные шарики, упаковка для замечательных тортов, и даже на выставку сделали крутую вывеску, которая светится, вау, короче.
Также, сделали несколько внутренних заданий для бренда, например, тематические открытки, приуроченные к священному месяцу Рамадан.
#lupo#lupodesign
Бог есть? Ну кто-то же создал этот логотип…
⠀
С божественными усилиями мы разработали логотип и фирменный стиль для российского производителя чаш с внушающим названием – Тор.
⠀
Исторический. Сильный. Божественный.
⠀
Логотип заключает в себе силу и крепость Мьёльнера, молота скандинавского бога Тора, в свою очередь напоминающего силуэт чаши.
⠀
Неповторимый, как каждый удар молнии, патерн заключает в себе всю мощь богов.
⠀
Мы считаем, что у каждого бренда должна быть такая же мощная история за спиной. Это определенно путь к успеху.
⠀
Чаши уже в продаже. Подробнее ознакомиться с условиями можно у них в Инстаграме.
⠀
#КрепкиеКакМолотТора
#lupo#lupodesign