Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Config — ежегодная конференция Figma возвращается! #config
75+ спикеров, 50+ выступлений и конечно же долгожданные релизы и анонсы новых фич ждут тебя 21 и 22 июня!
Регистрируйся: https://config.figma.com
Ох, так не терпится рассказать вам сегодня про все обновления! Будет круто, не пропусти трансляцию, регистрируйся: https://config.figma.com/
Начало в 18:00 по Москве сегодня! #config
Config 24 часа: 10-11 мая пройдёт ежегодная конференция Figma! Целые сутки выступлений от 100+ (!!) интересных спикеров и команды Figma! Начало в 18:00 МСК.
Традиционно Дилан Филд откроет конференцию презентацией новых ооочень долгожданных фич! Регистрируйся и не пропусти: https://config.figma.com/. Записи всех выступлений будут доступны через неделю после конференции. #config
Запись выступления основателя Figma Дилана Филда для всех, кто пропустил Config! Дилан не только анонсировал новинки и показал всё в живых демонстрациях, но и поговорил о том, как совместная работа в дизайне продолжает набирать популярность и помогает создавать что-то большое. “Ничто выдающееся не делается в одиночку” — подытожил он. #config
→ https://youtu.be/v4g-oZ6mFIc
До начала Config 2021 остался один час! Как принято, она начнётся с презентации новинок! Как думаешь, что будет анонсировано сегодня? Предлагаем обсудить это с друзьями и сверить результаты после презентации — мы опубликуем все анонсы! #config
Одна неделя до Config! Время регистрации продлили до понедельника, ещё есть время зарегистрироваться и рассказать друзьям! #config Что нужно знать о конференции:
• 21 и 22 апреля с 19:00 до 00:00 по Москве
• 60 спикеров, три темы: “Embracing the mess”, “In the file”, “Shifting team culture”
• Анонсы и релизы новых фич и истории их создания от команды
• Варенье из инжира? 😍
👉👉👉 Регистрируйся: https://config.figma.com/
Что может быть лучше одного дня Config? Конечно же целых два дня конференции! 😍 21 и 22 апреля будет проходить долгожданная ежегодная конференция Figma. Начало в 19:00 и окончание в полночь по Москве в оба дня. #config
Более 50 спикеров изо всех уголков планеты (включая меня😎) поделятся своим опытом, знаниями и историями связанными с Figma, совместной работой и творчеством. 👉 Обязательно успей зарегистрироваться до 15 апреля, рассказывай всем друзьям и коллегам: https://config.figma.com/
Config возвращается! Следующая всемирная виртуальная конференция Figma пройдёт 21 апреля 2021 — присоединяйся! #config
На сайте config.figma.com ты можешь подписаться на оповещения о начале регистрации. Хочешь рассказать о своей команде, внутренних процессах и совместной работе в Figma? Ты можешь подать заявку на выступление (на английском) до 21 февраля.
💥💥💥Сегодня в 18:00 (Мск) стартует очередной #Config Figma. На нем будут представлены обновления.
Регистрируйся и смотри по ссылке https://config.figma.com/
В ближайшее время будет информация по всем обновлениям.
Вступительное выступление Дилана Филда (Dylan Field) с Config Europe теперь доступно для просмотра. Узнай как работают новые фичи представленные сегодня, а также какие новинки нас ожидают этой осенью и зимой! #config
Записи остальных выступлений с конференции будут доступны 15 октября!
▶️https://youtu.be/lWy4fB3G9Gc
Последний шанс зарегистрироваться на нашу онлайн конференцию Config Europe — это бесплатно! Начало через час! #config
Регистрируйся: https://hopin.to/events/config-europe
Подробности: https://config.figma.com
Config Europe — вторая конференция Figma уже не за горами!
🌏 Конференция проводится полностью онлайн
📅 17 сентября 2020
🕓 14:00 – 19:00 по Москве
🤑 Вход бесплатный для всех!
Регистрируйся уже сейчас и рассказывай друзьям: https://config.figma.com#config