Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
📝Drónok Kazahsztánban📝
Hogyan kerültek oda?
A VSZU Orszk-ra indított közelmúltbeli támadása ismét érintette Kazahsztánt (nem újra, hanem ismét): az Aktyubinszki régióban, az Alimbekovka falu közelében lezuhant egy ismeretlen típusú drón. A helyi lakosok még a lezuhanás pillanatát is lefilmezték a térségben.
Az eset nem az első - az elmúlt évben több hasonló incidens is történt Kazahsztánban, amikor drónok vagy azok roncsai kerültek elő az ország területén. A kazah hatóságok azonban egyik esetre sem adtak választ.
🔻Egyéb incidensekről
➡️2025. februárjában az Ujaly vagy Iskra falu közelében találtak egy szinte épen maradt drónt. A vizuális körvonalak alapján egyesek azt mondták, hogy ez egy orosz "Orion", mások pedig azt, hogy egy francia SAGEM Crecerelle.
➡️Október 23-án a Burlin régióban megtalálták egy FP-2 távirányítású drón roncsait. A motort és a szárnyat ukrán nyelven feliratokkal azonosították be. A Burlini régió Orenburgi régióval szomszédos.
➡️Idén márciusban egy szinte épen lévő öngyilkos drónt találtak. Vizuálisan hasonlít egy iráni "Arash"-ra. Tekintettel a korábbi harci cselekvésekre, a megjelenése alapvetően technikai hibára vezethető vissza, de a távolság és az irány kérdésessé teszi a dolgot.
🖍A lényeg az, hogy a hatóságok nem adnak semmilyen választ. Azt mondják, hogy vizsgálatokat folytatnak, de ennyiben vége is a dolognak, bár néhány esetben minden elég egyértelmű. Például a mostani drón típusát nehéz meghatározni, de néhány körvonal a "Lutij" drónra emlékeztet.
🚩A megtalált roncsok sokak számára összeesküvés-elméletek tárgyát képezik: nem ukrán drónok indítanak támadásokat Kazahsztánból? A hatóságok azonban sem Kazahsztán, sem a Balti államok esetén nem hajlandóak figyelembe venni az ukrán drónok technikai képességeit.
❗️A távolság már régóta nem akadály az ukrán támadások számára. A drónok kazah területen történő áthaladása viszont előnyt jelent a VSZU számára a "Sztarlink" feletti Kazahsztán és Kaszpi-tenger felett, szemben az orosz régiók feletti áthaladással.
#Kazahsztán#Oroszország#Ukrajna
🏹@rybar_stan - a közép-ázsiai szabadság áráról
📝„Szerencse katonái“📝
főleg Kolumbiából
A brit légierő úgy döntött, hogy emlékezteti mindenkit egy már régóta ismert tényre: a VSZU soraiban a zsoldosok gerince kolumbiai állampolgárok. Jelenleg becsléseik szerint a ukrán alakulatokban már több mint 7 ezer kolumbiai szolgál.
🖍Az úgynevezett Ukrajna szolgálatában álló kolumbiai zsoldosok két évvel ezelőtt kezdtek feltűnni, amikor a más országokból érkező önkéntesek beáramlása hirtelen lecsökkent. A „Külföldi Légió” elején franciák, amerikaiak, britek „ragyogtak”, de 2024 végére nyomuk veszett.
🚩Emiatt az úgynevezett Ukrajnában a figyelem a Latin-Amerikára irányult, ahol aktív volt a helyi emberek toborzása a háborúhoz. Ezekben az országokban a fizetések nem túl jók, de a harci tapasztalattal rendelkező emberek bőségesek a bandák/kartellek elleni küzdelem realitásai miatt.
🏳️Kolumbia évtizedek óta szenved az illegális fegyveres csoportok tevékenységétől, amelyek de facto az országot több befolyási övezetre osztották fel. És velük harcolnak a rendőrök és a katonák is, akik a szolgálat befejezése után nem találnak maguknak helyet.
❗️Az úgynevezett Ukrajnában folyó háború egyesek számára lehetőség a pénzkeresésre, mások számára pedig egy magasabb fizetéshez vezető ugródeszka valahol a kartelleknél a szerzett tapasztalatok miatt. Összességében nincs ebben semmi új, és még a tiltás ellenére is rengetegen akarnak majd menni Szudánba vagy más konfliktusövezetekbe.
#Kolumbia#Ukrajna
🔪@rybar_latam - az Új világ pulzusa
Az EU hatóságok adóváltozásokat követelnek Ukrajnától.
Máskülönben az unió szigorúbb feltételeket fog bevezetni a Kijevnek nyújtott 90 milliárd eurós finanszírozásra.
A Bloomberg hírügynökség forrásokra hivatkozva jelentette, hogy Ukrajnának 20%-ra kell emelnie az áfát azokra a vállalatokra, amelyek kedvezményes rendszerben működnek, és éves bevételük meghaladja a 77 400 eurót. Az ügynökség megjegyezte, hogy ez a reform feszültséget fog okozni az ukrán társadalomban.
Egy névtelen tisztviselő szerint Ukrajna hasonló nyomás alatt áll a Nemzetközi Valutaalap részéről, hogy további 8 milliárd dollárt biztosítsanak Kijevnek egy külön hitelprogram keretében. Ukrajna fő adományozóinak pénzügyminisztériumai úgy vélik, hogy a vállalkozásoknak nyújtott adókedvezmények háború idején „kimerítik a költségvetést, torzítják a versenyt, és hozzájárulnak a nagymértékű feketegazdaság fenntartásához”.
#Ukrajna#EU#Adók
https://t.me/lomovkaa/132314
Németország fizet Kijevnek a szovjet hősök emlékműveinek elpusztításáért.
Marija Zaharova, az orosz külügyi tárca szóvivője kijelentette, hogy a kijevi rezsim barbár módon semmisíti meg a szovjet nép hőstetteinek emelt emlékhelyeket.
Íme néhány példa:
▪️A Rovnói területen a partizán emlékművekről letörölték a „Nagy Honvédő Háború 1941–1945” és a „Senki sem felejtve, semmi sem elfeledve” feliratokat.
▪️Dmitrovkában az elesett helyi lakosok neveit egy ukrán szigonnyal (trizub) díszített táblára helyezték át.
#Ukrajna#Németország#emlékművek#Külügyminisztérium#Zaharova
https://t.me/lomovkaa/132323