Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Сегодня день главного кота! 💡🍊😌
💜
😊
Что мы придумали в этот раз в честь нашего гения? Гениальное применение палетке теней, например!
Чекай туториал💅
Безумно скучаем и очень ждем
С днем рождения, Мин Юнги 🐾
#sodalovesbts
Результаты розыгрыша уже сегодня! Мы с вашими призами уже готовы 🎁💜⛓️
А кого это там на фоне слышно? Завтра красимся на концерт, получается?
😏
#sodalovesbts
В Корее уже наступил день рождения Хоби! Наша надежда, вдохновение, лучик солнца и главный по ноготочкам
☀️🐶
🤩💅
🌟 Раздумываете над образом на концерт? Теперь у нас есть супер комбо туториалов more-макияж + more-маникюр💿
Уже на следующей неделе у нашей легенды начинается тур, всем приготовиться! 🏁
Но это еще не все, завтра будет сюрприз для Арми 👀
💜
#sodalovesbts
😩
😩
🤩
🤩
👻
👻
👻
😭
😭
😭
🤩
🤩
🤩
🤩
ОЧЕНЬ СИЛЬНО ЖДЕМ ПЯТНИЦУ
Песня уже звучит как соти аоти + от нас респект за стразики
В моих снах так выглядит анонс нашего коллаба…
#sodalovesbts
На часах стримить новый альбом Пак Чимина!
🤩🎧🤩🤩✨
🤩 MUSE – это буквально то, чего нам всем не хватало все это время, словно глоток свежего воздуха
Мир очистился, трава позеленела, моментальный прилив вдохновения 🤩
А сколько макияжей можно сделать! Бора Сода-тян уже подобрала продукты под каждую песню 💜
Muse Чимина 🤝🏻 Сода-тян
Или комбо, которое украдет твое сердце
#sodalovesbts
🌟 Год назад вышел невероятный FACE, который не перестает вдохновлять нас по сей день ✨
Приглашаем вас на вечер воспоминаний в компании с любимым альбомом 🎶
Меню туториалов: 🪩Like Crazy,❤️Face-off, а на десерт новенький Set Me Free pt. 2!
🦋
#sodalovesbts
Новый Год еще не настал, а у нас уже есть повод праздновать!
С днем рождения, Ким Тэхён! 🐯💜⭐️
Спасибо, что всегда согреваешь своими песнями, даже будучи далеко (скучаем 😭)
Ко дню рождения Тэ мы вдохновились прекрасной Love Me Again из его сольного альбома Layover
✨
Скорее смотри, что получилось👀
#sodalovesbts
🌜 HAPPY JIN DAY 🤍
С днем рождения нашу луну и звезды, любимого астронавта, сержанта Ким Сокджина 🫡 очень скучаем и ждем не дождемся возвращения!
Спасибо, что ни на секунду не перестаешь вдохновлять и вызывать улыбку
🐹
Приглашаем вас в макияжное путешествие вместе с малышом Утто под прекрасную песню, которую Джин подарил нам год назад 🪐
Захватите с собой парочку любимых палеток! Взлетаем 💫
#sodalovesbts
🦢 Мы так долго держали ее в секрете…
Но Чонгук сегодня утром достал крылья и пришел разорвать чарты своим альбомом и сказать, что прямо сейчас самое время вам познакомиться с нашей новинкой!
Ladies and gentlemen, her – Black Swan mascara 🪶
Вдохновлена легендарной песнейлегендарной группы (и думаем станет легендой и у нас)
Сегодня мы надеваем черное, слушаем Golden, Map of the Soul 7 и освобождаем место в косметичке – новая легенда уже на пути во все корнеры Soda и в ваши сердечки
🖤💅
#sodalovesbts
С днем рождения, Ким Намджун🌸
🌸 Сегодня мы вдохновляемся одной из самых красивых песен Намджуна – любимая Wild Flower!
Рецепт Wild Flower от Soda:
Запускаем фейерверк на подвижном веке оттенком Fireworks
🎆 + вокруг сеем поле сверкающих цветов оттенком Eternity ♾ (прямо как наша любовь к Наму)
А вот тут можно посмотреть полную версию, как получилось это у нас 💜⭐️
#sodalovesbts
Сегодня у нас особенный случай! Сегодня мы собираемся на долгожданный концерт! 🤩💕
Это ли не отличный повод потестить новинки и надеть любимые аксессуары?
Путь не близкий, но ради Юнги хоть на край света 🥰
Присоединяйтесь🛸
#sodalovesbts
Сегодня ровно два года, как вышла королева Butter, а значит самое время напомнить вам о наших невероятно мягких, удобных и милых кистях, вдохновленных образом Чимина из Butter!💛
🥰
💃🧈
#sodalovesbts