Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
В Сорокском районе Модловы сегодня стартовала масштабная акция по благоустройству памятника "Жертвам фашизма". Поддержку в этой работе оказывают местные жители, представители властей и дипломаты РФ, сообщил глава Координационного совета "Победа" Алексей Петрович.
Монумент, расположенный между городом Сороки и селом Косоуцы имеет уникальное значение, рассказал Петрович.
"Памятник был установлен еще в 1971 году и посвящен всем жертвам Великой Отечественной войны, погибшим на молдавской земле с 1941 по 1944 год. Его воздвигли в то время, когда трагедию людей воспринимали как общую боль", — подчеркнул Петрович.
Глава комитета отметил, что мемориальная акция приурочена к новой знаковой дате — Дню памяти жертв геноцида советского народа, который в этом году впервые будет отмечаться 19 апреля.
"Надеюсь, общими усилиями нам удастся придать этому место вид, достойный памяти павших", — заключил Петрович.
#Pobeda
Sputnik Молдова ¦ Telegram ¦ Сайт ¦ VK ¦ OK ¦ Rutube ¦ Дзен ¦ MAX
82-ую весну освобождения от фашистов встречают сегодня в Тирасполе.
На Мемориале Славы горожане во главе с руководством Приднестровья возложили цветы к могилам павших и почтили их память минутой молчания. #Pobeda
Sputnik Молдова ¦ Telegram ¦ Сайт ¦ VK ¦ OK ¦ Rutube ¦ Дзен ¦ MAX
Уроженцы Молдовы – Герои Советского Союза: летчик-истребитель Степан Колесниченко.
На фронт курсант авиашколы был направлен весной 1942-го. К июлю 1943 года лейтенант Степан Колесниченко был помощником по воздушно-стрелковой службе командира 519-го истребительного авиаполка. Особо отличился в первые дни сражения на Курской дуге в июле 1943 года большие группы самолетов Люфтваффе обрушились на передовые позиции частей Красной Армии.
Последний бой для Колесниченко случился 30 августа 1943 года: он был атакован пятеркой Ме-109 в небе Сумской области и сбит. Он провел 135 боевых вылетов и 27 воздушных боев. На его счету 21 лично сбитый самолет и 4 в составе группы.
▪️За мужество и героизм, проявленные в боях с немецко-фашистскими захватчиками, 2 сентября 1943 года лейтенанту Колесниченко посмертно было присвоено звание Героя Советского Союза. Также награжден орденами Ленина, Красного Знамени, Красной Звезды.
#Pobeda
Sputnik Молдова ¦ Telegram ¦ Сайт ¦ VK ¦ OK ¦ Rutube ¦ Дзен ¦ MAX
В Слободзейском районе Приднестровья, между сёлами Парканы и Бычок, поисковики нашли захоронение времён Великой Отечественной войны.
Братскую могилу обнаружили участники отряда "Память и слава" и молодёжного движения "Звезда".
Во время планового поиска места захоронения бойца Красной армии была найдена могила, в которой покоились, предположительно, 6 павших воинов.
▪️Героев планируют перезахоронить 9 мая, в День Победы, на Мемориале славы в Парканах. Фото: МД "Звезда".#Pobeda
@suvorovdnestr
В Гагаузии покажут фильм о Ясско-Кишинёвской операции
Речь идет о документальном фильме "И поклонимся" режиссёра Николая Гибу. Показ пройдет 16 апреля в Доме детского творчества города Вулканешты.
Фильм посвящён событиям Ясско-Кишинёвской операции - одной из ключевых операций Великой Отечественной войны. В ленте - хроника военных лет и кадры мемориального комплекса "Шерпенский плацдарм".
▪️После показа состоится встреча с председателем комитета "Победа" Алексеем Петровичем.
Вход свободный. #Pobeda
Sputnik Молдова ¦ Telegram ¦Сайт ¦ VK ¦OK ¦Rutube ¦ Дзен ¦MAX
Останки 16 неизвестных советских солдат-освободителей Молдовы от нацизма в годы Великой Отечественной войны захоронят на Шерпенском плацдарме 2 мая, рассказал глава комитета "Победа" Алексей Петрович.
"Готовим церемонию захоронения останков солдат Красной армии, которая пройдет 2 мая на Шерпенском плацдарме. Пока это останки 16 безымянных красноармейцев", - рассказал Петрович, пояснив, что павшие герои были обнаружены в ходе поисковых экспедиций, которые регулярно ведутся на местах сражений Великой Отечественной войны.
#Pobeda
Sputnik Молдова ¦ Telegram ¦Сайт ¦ VK ¦OK ¦Rutube ¦ Дзен ¦MAX
🔸В Дубоссарском районе Приднестровья отмечают годовщину освобождения от немецко-румынских захватчиков.
Первыми были освобождены сёла Дубово, Дойбаны-2, Койково, Гармацкое и Цыбулёвка.
Дату сельчане отмечают 4-го апреля, а в селе Дойбаны-2 торжественная церемония прошла сегодня.
Жители села почтили память воинов-освободителей: при освобождении села погиб 81 красноармеец.
К братской могиле сельчане возложили цветы, а в память о героях пронесли полотнище Георгиевской ленты. #Pobeda
Sputnik Молдова ¦ Telegram ¦ Сайт ¦ VK ¦ OK ¦ Rutube ¦ Дзен ¦ MAX
Поисковики Молдовы присоединились к международной акции "Сад Памяти".
"В рамках международного проекта активисты поисковых организаций высадили на воинском кладбище мемориального комплекса 'Шерпенский плацдарм' саженцы остролистного клена, дополнив заложенную несколько лет назад Аллею Памяти", — рассказал глава комитета "Победа" Алексей Петрович..
По его словам, акция прошла при поддержке Русского дома в Кишинёве. #Pobeda
Sputnik Молдова ¦ Telegram ¦ Сайт ¦ VK ¦ OK ¦ Rutube ¦ Дзен ¦ MAX
В селе Корпач Единецкого района проходят праздничные мероприятия, приуроченные к 82-й годовщине выхода Красной армии на государственную границу.
Торжества организованы у памятного воинского знака, где собрались местные жители, представители власти и общественных организаций. #pobeda
Sputnik Молдова ¦ Telegram ¦Сайт ¦ VK ¦OK ¦Rutube ¦ Дзен ¦MAX
В северной столице Молдовы Бельцах в эти минуты проходят торжества, посвященные 82-й годовщине освобождения города от фашистской оккупации. #Pobeda
Sputnik Молдова ¦ Telegram ¦ Сайт ¦ VK ¦ OK ¦ Rutube ¦ Дзен ¦ MAX
В Дондюшанах отметили 82-ю годовщину освобождения от фашистской оккупации.
У памятника героям Великой Отечественной войны прошла торжественная церемония возложения цветов к Вечному огню и митинг.
"В рамках торжественных мероприятий была представлена выставка фотографий и документов "Из безвестности в бессмертие", посвящённая 15-летию возрождения Поискового движения Молдовы. Экспозиция рассказывает о судьбах солдат и офицеров Красной армии, погибших за освобождение Молдовы от фашизма, чьи имена удалось восстановить в ходе полевых и архивных поисковых работ, — отметил автор telegram-канала @soldat_pobedi Алексей Петрович. #pobeda
Sputnik Молдова ¦ Telegram ¦ Сайт ¦ VK ¦ OK ¦ Rutube ¦ Дзен ¦ MAX