Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Пока писал последние посты я узнал, что существует ежегодная гонка по подъему на “Пайкс-Пик”. Старт на высоте ~2862 м, финиш - 4302 м. Трасса имеет 156 (!!!) крутых поворотов.
Считается одной из самых трудных и опасных гонок из-за слепых поворотов, большого количества виражей и экстремальных условий (меняющаяся погода, резкая смена высоты, живность и др) на трассе без ограждений.
У гонки также есть другое эпичное название “Гонка в облаках”. 🏎
Вот вам 10 минутное видео
#CO
The Broadmoor Manitou & Pikes Peak Cog Railway 🚂
По приезде в штат Колорадо в голове сразу появилась мысль, что здесь обязана быть красивая железная дорога в горы, вот и она.
Зубчатая железная дорога ведет на вершину “Пайкс-Пик” (14,115 фут или 4,302 метров над уровнем моря), что входит в цепь “Скалистых гор”.
Длительность поездки ~3.5 часа туда-обратно.
#CO
Я ел бычьи яйца, теперь официально 🐂
Когда-то я смотрел видео о блюдах в каждом штате, и в Колорадо есть такая штука как “Rocky Mountain Oysters”. Как понимаете, оно никак не связано с устрицами 🙂
Перед отъездом из штата хотел попробовать. Если вкратце: без вкуса и запаха, консистенция - кальмар, все обжарено в панировке. По-моему, в панировке можно что угодно съесть. Подается с большим количеством разных домашних соусов и, как по мне, только соусы и придают вкус. Под пиво пойдет.
Если вдруг ищите, что посмотреть за обедом, то вот видео как их готовят.
Приятного аппетита.
#CO
Факт дня - Колорадо один из самых больших штатов по производству пива в стране.
Я пытался искать статистику, но везде информация разнится (будем считать, что где-то на третьем месте). Да и кому какая разница на каком он месте? Главное, что производят🍺
Как настоящий исследователь взял набор «exploration»
🍺
#CO
Год жизни в штате Колорадо, подтверждаю кажое слово в видосе😂
Если можно описать местных простыми словам, то:
горы, горы, крафтовое пиво, горы, субару, хайкинг, горы, лыжи, горы, легинсы, горы, горы горы.
А, ну и еще худшие в мире водители, забыл добавить
И еще один смешной про местных
#CO
Утешительный приз в виде замерзшего водопада Zapata falls для тех кто не умеет заранее смотреть информацию о погоде.
В получасе езды+ходьбы от дюн в скале находится небольшой водопад. Чтобы добраться зимой нужно пройти по льду между скал, но оно того стоит.
#CO
Во второй день поездки поднялся настолько сильный ветер, что из-за песка не было видно гор, сегодня было точно не до катаний на борде в дюнах. Боюсь представить что происходило в самом парке.
Нравится снимать местные просторы из машины, поэтому теперь будет рубрика дорог 🚗
#CO
Песчаные дюны в центре штатов
Grand Sand Dunes - один из известных национальных парков штата Колорадо, для меня наравне с Mesa Verde.
В основном люди сюда едут ради видов, фотографий и катаний с песчаных холмов на «сэндборде» и «ледянках».
Планировалось тоже покататься, но ветер 17mph с порывами до 35mph, тяжело долго гулять: сильный холодный ветер и песок открывают новые грани страданий. Зато парк сегодня оказался бесплатным для посещения.
Обязательно иметь очки (желательно горнолыжные), маску, солнцезащитный крем и закрывать все места куда может попасть песок.
На 2 фотке кто-то разбил палатку в дюнах 😀
#CO
До переезда из Колорадо осталось меньше месяца, еще нет идей как будем переезжать вместе с мебелью, но нужно выполнить план по штату.
😃
Неизвестно когда сюда снова вернусь, давно хотел посетить один из национальных парков - Great Sand Dunes.
В одну сторону ехать 3,5 часа.
Зато первый раз оформил налоговую. Оказалось муторно, но не так сложно как представлял, предварительно даже денег обещают вернуть за прошлый год 🤞
#CO
Продолжение с выходной вылазки.
Недавно играл в red dead redemption 2, все это сильно напомнило декорации к игре - горы, ковбои, арабские скакуны, зимние американские пейзажи. 🤠
#CO
Caribou Ranch Open Space
Выбрались на выходные в горы. Народ ходит в снегоступах и на лыжах по маршруту. Довольно популярный трейл с заброшенными ранчо и шахтами добычи серебра.
Час езды от Денвера на запад.
#CO