Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
— Ну как суп, Шанс?
— Трагедия. Ну а кофе еще ничего.
— Но все равно не бесплатно.
— Да, я знаю.
— Оставил бумажник во фраке, что ли?
— А что, я так уже пытался однажды не заплатить?
— Да, за суп.
— Точно.
#ВИДЕОТЕКА
#HardTarget
#ТруднаяМишень
#JohnWoo
#ДжонВу
#JeanClaudeVanDamme
#ЖанКлодВанДамм
#VHS
#АндрейГаврилов
🎬📷 Джон Ву на съемочной площадке фильма «Трудная мишень».
Во время первого тестового показа картины Ву обратился к одному из её продюсеров и заметил, что в Гонконге они никогда не делали таких превью. Продюсер в ответ спросил его, как он тогда узнает, нравится ли людям фильм или нет. На это режиссер воскликнул: «О, если им это не нравится, они поджигают кинотеатр и режут сиденья».
#ВИДЕОТЕКА
#JohnWoo
#ДжонВу
#HardTarget
#ТруднаяМишень
#JeanClaudeVanDamme
#ЖанКлодВанДамм
#LanceHenriksen
#ЛэнсХенриксен
📷Джон Траволта, Джон Ву и Кристиан Слейтер на премьере фильма «Сломанная стрела», 1996 год.
Этим фото анонсирую свой цикл текстов о фильмах 30-летней давности. Я тут слегка задолжал уже с другими постами, так что в ближайшее время постараюсь потихоньку обещанное написать и выложить. А цикл запущу пораньше, так как в прошлом году мне такая идея в голову пришла достаточно поздно.
#ВИДЕОТЕКА
#BrokenArrow
#СломаннаяСтрела
#JohnTravolta
#ДжонТраволта
#JohnWoo
#ДжонВу
#ChristianSlater
#КристианСлейтер
🎬📷Джон Ву, Кристиан Слейтер и Джон Траволта на съемках и премьере фильма «Сломанная стрела».
#ВИДЕОТЕКА
#BrokenArrow
#СломаннаяСтрела
#JohnTravolta
#ДжонТраволта
#ChristianSlater
#КристианСлейтер
#JohnWoo
#ДжонВу
В 1994 году боевик «Скорость» выстрелил так, что руководство студии «20-й Век Фокс» незамедлительно решила пустить в дело еще одну работу сценариста Грэма Йоста, пока еще было горячо. Так на свет появился второй голливудский фильм Джона Ву «Сломанная стрела». Эта картина тоже отлично проявила себя в прокате, но такого всеобщего восторга уже не наблюдалось. Да и сам гонконгский маэстро жанра экшн следом поставит культовый фильм «Без лица», так что «Сломанной стреле» как будто суждено было остаться в тени.
И вроде бы все по делу. Студия подсократила на монтаже (далее это войдет в привычку с голливудскими работами Джона Ву) первую версию картины от самого режиссёра. Причём в окончательном варианте «Сломанная стрела» больше напоминает стандартный голливудский боевик 90-х, чем авторскую ленту с фирменным почерком мастера. Да, ставка сыграла, потому что в прокате фильм выступил очень прилично, но самому постановщику он лишь помог закрепить его репутацию кассового режиссёра — и не более того. В общем, ничего личного, только бизнес.
Однако все же почему-то к «Сломанной стреле» хочется возвращаться и 30 лет спустя. И в первую очередь — ради потрясающего актерского перфоманса Джона Траволты, который создал едва ли не самый обаятельный образ антагониста в боевиках эпохи VHS, если не больше. Траволта в роли решившего похитить две ядерные бомбы майора ВВС США здесь царит на экране, притягивая к себе внимание буквально в каждой сцене со своим участием, буквально каждой фразой и жестом. К его безусловному гению и таланту еще и добавился тот невероятный кураж, который он поймал на съемках «Криминального чтива». И это просто надо видеть.
Кристиан Слэйтер в главной роли, конечно, старается, и даже большую часть трюков выполнил самостоятельно, но Траволта в этом фильме переигрывает его уже одним прикуриванием сигареты. Вот настолько он хорош в «Сломанной стреле», и вот почему Джон Ву следом пригласил и в «Без лица», где от их дуэта с Николасом Кейджем буквально искрило. Но об этом как-нибудь потом.
А «Стрела» же при всей своей стандартности все равно выглядит на голову выше большинства современных боевиков. Это качественное и профессионально сделанное кино, где вроде бы и придраться особо не к чему. Разве что только в черновом варианте рука Джона Ву действительно могла бы быть более заметной, но это мы уже вряд ли когда-нибудь узнаем. То, что получилось в итоге, вполне способно вас увлечь и даже приятно удивить, если вы еще ни разу не смотрели этот фильм. Да, не жанровый шедевр, но кино по-своему примечательное.
P.S. И еще у вас гарантированно останется в памяти музыка Ханса Циммера к «Сломанной стреле», которая звучит как причудливый микс Вангелиса и Эннио Морриконе времен спагетти-вестернов. Что, в общем-то, в тему, если увидеть, где по сюжету разворачиваются события фильма.
#ВИДЕОТЕКА
#ВИДЕОТЕКАКино1996
#BrokenArrow
#СломаннаяСтрела
#JohnWoo
#ДжонВу
#JohnTravolta
#ДжонТраволта
#ChristianSlater
#КристианСлэйтер