TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 1 слични објави

Пребарај: #mirnoye

当前筛选 #mirnoye清除筛选
DruschbaFM - English

@druschbaFm_en · Post #52600 · 27.03.2025 г., 08:02

⚡️ 🇷🇺 🇺🇦⚔️ Ukraine Fronts on the Morning of 27 March⚡️ 🔴#Sumy Direction: 🔴In #Sudzha Sector, to the west on Ukrainian soil, at #Vladimirovka, there is reportedly fighting (still unconfirmed without further proof; 1st blue arrow on map). 🟡 For #Veselovka, the battle is ongoing (1st black arrow). 🟡 In #Zhuravka as well. 🟡 In #Basovka, the AFU counterattacked, the battle likely shifted to its northern part. 🟡#Novenkoye, is Russian controlled (1st red arrow). 🟡 In #Kursk region, the RFAF entry into #Gogolevka has been confirmed. Reportedly, the fighting has already shifted to its southern part (4th black arrow). 🟡 In the area of the 'Sudza Gas Transmission Point' and the nearby border checkpoint, the fighting continues (5th black arrow). 🟡#Melovoy is under Russian control (2nd red arrow). To its west, Russian mobile groups continued to advance towards #Oleshnya (confirmed). 🟡#Oleshnya is still under AFU control. 🟡 At #Guyevo, there are heavy battles on its approaches. Reportedly, the RFAF have entered its northern part. 🗺 Map 2 🟡#Gornal remains under save AFU control. 🔴In #KrasnayaYaruga Sector, the AFU assaulted unsuccessfully in its northern part from #Popovka/#Demidovka up to #Grafovka, suffering heavy losses (6th/7th black & 3rd red arrow). 🎬 Video 🟡 At #Prilesye, lull. 🗺 All on Map 1 📌Reportedly, the AFU command has concentrated a strike group of over 4,000 militants in the vicinity of the border. Thus, further actions are to be expected. 🔴 In #Kharkov Direction, positional battles. 🔴#Svatovo Front: 🔴 In #Kupyansk and #Borovaya Sectors, positional battles without major changes. 🔴In #Liman Sector, there was a fog of war. Reportedly, the RFAF took #Novolyubovka and the day before yesterday #Mirnoye (the takeover of #Yampolovka to its east was never confirmed or proven) and they advanced sooth of #Kolodezi by 2 km. 🔴In #Seversk Sector, positional battles at #Belogorovka (#LPR) and #Verkhnekamenskoye. 🔴#ChasovYar Direction: 🔴In #ChasovYar Sector, positional fighting in the city's southern part and to the south towards #Stupochki continues. 🔴In #Toretsk Sector, the RFAF attacks north of the city in the area of the 'Seversky Donets-Donbass Canal'. 🟡 In #Toretsk itself, the battles are taking place north of 'Toretskaya Mine,' north and northwest of 'Avangard Stadium' and in southern 'Zabalka Microdistrict'. 🔴#Pokrovsk Direction: 🔴 On the right Flank, far to the east, Russian troops attack in the area of #Aleksandropol. 🔴 South of the City, heavy battles did not result in major changes. 🔴 On the left Flank, the RFAF are approaching #Novoaleksandrovka. 🔴#Komar Direction: 🔴In #Konstantinopol Sector, fights for #Konstantinopol and at #Razliv. 🔴 In #Komar Sector, Russian troops advanced up to 400 m in #VolnoyePole and took up new positions in the central part of the settlement, taking heavy losses. 🔴#Zaporozhye Direction: 🔴In #Orekhov Section, positional battles are taking place In the area of ​#​MalayaTokmachka - #Rabotino. Further west, the AFU unsuccessfully counterattacked. 🟡 In #Shcherbaki, the RFAF took reportedly the southern part beyond the motorway. 🟡 At #MalyeShcherbakito the west, the battle continues. The village is still not completely under RFAF control. 🟡 In #Stepovoye, further west, fighting in the large village boundaries without major changes. 🟡 In #Lobkovoye, the the RFAF advanced slightly northwards (unconfirmed). 🟡#Pyatikhatki remains under RFAF control. 🔴 In #Kherson Direction, several villages came under fire from the AFU. 💥#OldRussia: 🔵In #Belgorod Region, Channel One journalist Anna Prokofiyeva was killed. 💥#RestUkraine: 🔵 The RFAF struck massively #Sumy, #Kharkov and #Dnepropetrovsk. ⚠️ The Term 'Reportedly' always means that it is unconfirmed! 🎞 Video Source 🗺 Maps @olegtsarov; @divgen 📋 Sources: CC; Tsarov; ⚡️2M; 🇺🇦Fiend;😼Kotenok 🕰As of 27 Mar 2025; 06:38 GMT+3;📃26 Mar 📱 Join GLOBAL DEPTH to boost your TG Feed 💬Join Military Chat for Comments & Discussions 🇺🇦On Ukraine Observer you will find your daily independent Ukraine War Battle Update