Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
🇰🇷✈️ Южная Корея запустила серийное производство истребителей KF-21 «Порамэ»
💣 Республика Корея вывела на конвейер собственный многоцелевой истребитель KF-21 «Порамэ» — первый серийный самолёт сошёл с линии 25 марта на заводе в Сачхоне (провинция Северная Кенсан). Это завершение 25-летнего проекта, начатого ещё в 2001 году, цель которого — заменить устаревшие F-4 и F-5 и снизить зависимость от зарубежных поставок боевой авиации.
⚡ KF-21 — истребитель поколения 4.5 с элементами «стелс», разработанный Korea Aerospace Industries. Первый полёт состоялся в 2022 году, испытания завершены в январе 2026-го, а поставки в ВВС уже начались. План — не менее 120 машин. По уровню это аналог Rafale или Gripen: современная авионика, АФАР-радар, системы РЭБ, но без внутреннего отсека вооружения. Стоимость — $83–112 млн за единицу, что заметно дешевле F-35.
🧭Президент Ли Чжэ Мён назвал проект символом стремления страны к самостоятельной обороне и новой опорой для развития ВПК. Сеул делает ставку и на экспорт: интерес уже проявили Индонезия, ОАЭ, Саудовская Аравия, Малайзия и Перу. Первый контракт — на 16 самолётов для Индонезии — может быть подписан уже в апреле. Фактически Южная Корея закрепляется в узком клубе стран, способных самостоятельно создавать современные боевые самолёты.
👉Наш комментарий: Стоит признать, что Южная Корея совершила без преувеличения технологический прорыв, это действительно большое достижение для страны. Как когда-то не верили, что Южная Корея может создать свою собственную популярную в мире музыку, что не может запускать ракеты и выводить спутники, что ее косметика никому не зайдет, так говорили и про проект собственного истребителя - а теперь К-РОР, свои спутники выводятся, косметика - по всему миру, и вот теперь боевой самолет... Помимо Кореи только еще 5 стран могут этим похвастаться - США, Китай, Россия, Швеция, Франция... Даже Япония, Германия, Индия пока не могут (хотя вплотную подошли к этому).. Так что да, KF-21 - это круто... Ну и явно будут активно продавать на зарубежных рынках....
#Корея#Новости#ВПК#Авиация#KF21
🇰🇷🇮🇩Согласно сведениям Администрации программ оборонных закупок (DAPA), Южная Корея и Индонезия фактически согласовали объём передаваемых последней средств в соответствии с её долей в совместном проекте создания истребителя KF-21 Boramae.
💰Напомним, первоначально Индонезия должна была вложить в разработку 1,6 трлн вон (т.е. около 20%) и получить соразмерный объём «отдачи». Однако, сославшись на экономические трудности, Джакарта сократила свой вклад до 600 млрд вон, из которых к настоящему времени выплачено 536 млрд вон. Оставшиеся 64 млрд вон планируется перевести РК к июню т.г.
📦Окончательная
сумма включает в себя 350 млрд вон в обмен на передачу прототипа №5
KF-21, а также 174,2 млрд вон в счёт оплаты труда инженеров и расходы на
трансфер технологий. Таким образом, Индонезия получит (после полного «закрытия счёта») один из прототипов, а также документацию и технологии в рамках текущего уровня разработки истребителя (т.н. Batch-I, данная версия не обладает возможностями нанесения ударов по наземным целям).
📄Кроме того, стороны отдельно ведут переговоры на предмет заключения экспортного контракта на поставку 16 самолётов KF-21.
#Новости#Корея#Политика#DAPA#KF21#Истребитель#Индонезия#Проект
⚡️Јужна Кореја — представљен први серијски ловац KF-21 Boramae, који развија компанија KAI [Korea Aerospace Industries]; реч је о вишенаменској борбеној летелици која се класификује као авион 4.5 (4++) генерације.
→ Линк: /t.me/borbeni_efektivi
→ Линк: /t.me/borbeni_efektivi
🪖#Јужна_Кореја〣#KF21〣#Boramae〣#KAI〣#Ловац〣#Ваздухопловство
🇷🇸https://t.me/borbeni_efektivi
🇰🇷🤝🇮🇩Источники в оборонной промышленности Южной Кореи сообщают, что РК может подписать первое соглашение на поставку за рубеж истребителя KF-21 Boramae. Соответствующая церемония, якобы, состоится на базе компании-производителя самолёта Korea Aerospace Industries (KAI) в Санчхоне в рамках программы визита в Р. Корея президента Индонезии П. Субианто в период с 31 марта по 2 апреля. Завершить же заключение контракта предполагается в первом полугодии.
📄Вместе с тем, вместо изначально запланированной закупки 48 истребителей Индонезия, ссылающаяся на бюджетные ограничения, приобретёт в первой партии всего 16 боевых самолётов.
📌Напомним,
что в реализации программы KF-X, результатом которой и стал истребитель
KF-21, принимали участие Сеул и Джакарта. Последняя согласилась на
финансирование около 20% затрат на разработку (8,1 трлн вон или порядка
5,9 млрд долл.) в обмен на 48 самолётов IF-X (индонезийский вариант) и
трансфер технологий. Однако из-за финансовых сложностей Индонезия
неоднократно откладывала платежи, а в итоге сократила свой вклад до 600
млрд вон (1/3 от первоначальной суммы) и уровень передачи технологий.
🇰🇵❗Кроме
того, из-за возможного разглашения конфиденциальных сведений предметом
озабоченности стал факт возобновления дипломатических отношений между
Джакартой и Пхеньяном.
#Новости#Корея#Политика#Экономика#ВПК#Индонезия#Сделка#KF21#Экспорт#Визит#Истребитель#KAI