Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
ДТП на улице Лисковской, 6:
Водитель автомобиля #Subaru не справился с управлением и автомобиль начало заносить. Вначале въехал во встречное авто, а затем - в припаркованные.
Фото: Vasiliy Gapienko
Subaru обновила Outback. Кузов стал больше внедорожником, чем универсалом. В салоне - новая мультимедиа система, среди опций появилась вентиляция сидений. В базе в салоне искусственная кожа, но опционально доступна Наппа.
Рестайлинг не коснулся техники - под капотом тот же 2,4 л турбированный двигатель на 260 лс, полный привод и вариатор.
Subaru говорит о том, что Outback стал "более премиальным", но кажется этого нет и рядом.
Нравится - 👍
Не очень - 👎
#subaru
Subaru WRX STI - объект обожания всех уличных гонщиков тоже вот-вот вернется в производство. На сайте Subaru написано - «Скоро в продаже». На токийском салоне компания показала очередной прототип WRX STI Sport Prototype, он выглядит унылым и готовым к производству.
2,4 л бензиновый мотор, пока с неизвестной отдачей. На обычном WRX он выдает 271 лс, на STI по идее должно быть больше. Механическая коробка и полный привод. Хорошо, что он возвращается, но плохо, что он выглядит также скучно как и раньше.
Нравится - 👍
Не нравится - 👎
#subaru
Ураганную Subaru WRX STI не делают с 2021. Последняя генерация в стоке имела 2,5 л мотор на 310 лс и 393 Нм. Её тюнинговали изо всех сил и встречались экземпляры с 700 или даже 1000 лс.
WRX STI была легендой и разрывала чемпионаты. В 2021-м японцы решили, что наступило время экологии и электричества и остановили производство.
Но передумали. В Токио Subaru показала сразу два STI-концепта. Один все-таки электрический, другой с 2,5 л бензиновым мотором, значит легенда вернется.
#subaru
Subaru unveils Project Midnight, the fastest WRX in history .
🔥 With a 2-liter racing flat-four engine boosted to 670 hp and 680 Nm of torque, this beast revs up to an impressive 9500 rpm .
🚗💨 Weighing only 1120 kg thanks to a carbon fiber body, it sheds a whopping 453 kg for lightning-fast performance .
⚡️ And of course, it's equipped with all-wheel drive for that perfect grip! Don't miss the live debut at the Goodwood Festival of Speed 🏁
#Subaru#ProjectMidnight#WRX#GoodwoodFoS#Auto🏎💥
SUBARU диктует международные стандарты БПЛА
Aвтоконцерн SUBARU добился признания собственных решений для предотвращения столкновения дронов в качестве стандарта Международной организации по стандартизации ISO21384-3 (Беспилотные летающие системы: управление и процедуры).
Стандарты ISO - это универсальные требования, на которые в том числе должны ориентироваться мировые производители в быстрорастущей отрасли беспилотных летательных аппаратов (БПЛА).
Объем мирового рынка БПЛА оценивается в 22 млрд долл., а к 2029 году он должен вырасти до 41 млрд долл. На Японию приходится около 3 млрд долл. с перспективой роста до 5,5 млрд долл. к 2028 году.
Как любой другой быстрорастущий новый рынок, индустрия БПЛА ощущает острый недостаток международных правил и регулирования.
Правительство и бизнес Японии прикладывают значительные усилия для развития рынка БПЛА. Помимо военных заказов, рынок БПЛА Японии растет за счет активного использования беспилотных систем в коммерческом секторе, сельском хозяйстве, пожаротушении и помощи при стихийных бедствиях.
Основными производителями дронов являются компании Yamaha Motor, NTT e-drone Technology, PRODRONE, Mazex.
Международное признание стандарта SUBARU, обеспечит этой компании определенные преимущества на мировом рынке на ближайшую перспективу.
Концерн SUBARU начинал свою деятельность в 1920-е годы в качестве поставщика авиатехники и комплектующих, и по сей день производит вертолеты, и является важным звеном в производственной цепочке самолетов Boeing.
Признанное в качестве международного стандарта ноу-хау SUBARU, заключается в разработке особого алгоритма избегания препятствий, который на данном этапе распространяется на БПЛА-доставщики грузов, однако в будущем может быть тиражирован и на другие беспилотные летающие системы.
Положительное решение в пользу японского подхода было обусловлено простотой системы, которая снижает риски ошибок при практическом применении.
#Япония#БПЛА#ISO#стандарты#SUBARU