Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Каждое планировочное решение дома – это баланс эргономичности и комфорта. Мы проработали всё до деталей в нашем новом проекте, в результате чего даже небольшая студия является продуманной гармонией личного пространства. Этот проект – вызов для тех, кто готов жить по новым правилам и идти в ногу со временем, для людей с новым мышлением и отношением к жизни, дому, своему времени, потребностям и ощущениям. Проект призван изменить представление о границах дома – команда успешно объединила понятия личного и общественного пространства, сохранив за резидентами возможность выбирать между этими функциональными модусами. Дом создан для тех, кто хочет добиться сочетания эффективности, комфорта и эстетизации жизненного пространства во всех сферах, как в производительной и творческой, так и в коммуникативной и рекреационной.
Официальная страница проекта:
https://logos.moscow/
⠀
#Sense#SenseDeveloper
Мы - единомышленники, увлеченные профессионалы своего дела, эстеты, ценящие качество и создающие особую энергетику для каждого проекта компании.
⠀
«Наш опыт помогает нам создавать сложный и красивый продукт, делать особенными даже незаметные детали. Мы верим в то, что уникальность – это навсегда, поэтому создаем проекты такими, чтобы они нравились нашим покупателям и нам самим. Мы меняемся вместе с миром и учимся каждый день. Это позволяет нам достигать целей максимально современными и надёжными способами, а удовольствие от результата объединяет нас с теми, для кого мы работаем», - комментирует исполнительный директор Александр Мамаев.
⠀
#Sense#SenseDeveloper
«Наша команда - это увлечённые профессионалы с многолетним опытом работы на премиальном рынке недвижимости как в России, так и за рубежом. Мы хотим показать покупателям, каким может быть современный жилой дом высокого класса, в котором эмоциональный контекст находится в неотъемлемой связи с физическим восприятием. Уже сейчас мы разрабатываем три проекта в центре г. Москвы, которые представим в ближайшее время», - подчеркнул генеральный директор Юрий Матвеев.
#Sense#SenseDeveloper
Мы начали строительство дома Logos.
В настоящий момент в плановом режиме ведутся работы нулевого цикла. Застройщиком была заблаговременно осуществлена закупка и поставка на строительную площадку материалов, необходимых для выполнения данных работ.
В феврале 2022 года начаты работы по устройству шпунтового ограждения котлована. Также активно ведутся работы по устройству временных инженерных сетей, необходимых для бесперебойного осуществления строительно-монтажных работ на объекте.
Выполнение работ на конец марта составляет более 70%. Завершение работ по устройству шпунтового ограждения запланировано на первую половину апреля 2022 года.
#Logos#SenseDeveloper#Sense#ДомСоСмыслом
Мы получили проектную декларацию проекта Logos - ещё один этап на пути к воплощению наших идей пройден.
И пока наша команда активно организует ресурсы для строительства нового дома, вы можете одним из первых узнать детали проекта.
#Logos#SenseDeveloper#Sense#ДомСоСмыслом
Logos (от древнегреческого λόγος) — это целостность представлений, которой свойственно равновесие ума и сердца, баланс анализа и интуиции.
Наше видение Logos подразумевает объединение рационального и эмоционального аспектов. Во-первых, концепция дома Logos объединяет насыщенный спектр функциональных общественных пространств с личными, представляя миссию команды Sense объединять смысл и чувство в стильной и современной концептуальной архитектуре. Во-вторых, Logos расширяет коммуникативное пространство. Дом взаимодействует с окружающим миром через фасады, которые отражают окружающее пространство, а со своими жителями через своё внутреннее пространство для отдыха, работы, общения, медитации, занятий спортом, развлечения, уединения и встреч.
#Logos#SenseDeveloper#Sense#ДомСоСмыслом
Мы получили разрешение на строительство нашего нового проекта Logos.
Logos - это проект дома со смыслом, который является абсолютно самодостаточным пространством, окружающим своих обитателей рационально и функционально организованным наполнением. Выбирая между различными видами активности и отдыха, жители Logos смогут использовать места для отдыха, работы, общения, медитации, занятий спортом, развлечения, уединения и встреч.
Logos также учитывает потребность своих жителей быть в эпицентре социально-экономической жизни мегаполиса, предлагая им локацию, которая позволит пользоваться всеми возможностями жизни в центре города.
Дом Logos будет расположен в Даниловском районе, в 5 минутах пешком от метро Тульская.
Дом Logos
#Sense#SenseDeveloper#Logos#ДомСосмысломLogos#ДомЛогос