TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 15 слични објави

Пребарај: #arsi

当前筛选 #arsi清除筛选
Borkena

@borkena · Post #5914 · 03.03.2026 г., 18:44

Who Is Behind the Alleged Genocide Against Christian (Amhara) Communities in East Arsi, Ethiopia? – and When Will this Stop? https://borkena.com/2026/03/03/ethiopian-orthodox-christians-who-is-behind-the-alleged-genocide-against-christian-amhara-communities-in-east-arsi-ethiopia/#Ethiopia#humanrights#Arsi

Borkena

@borkena · Post #5916 · 04.03.2026 г., 05:22

Oromo Liberation Army Points Finger At Abiy Ahmed’s Admin. Over Arsi Massacre. Read more. https://borkena.com/2026/03/04/ethiopia-oromo-liberation-army-points-finger-at-abiy-ahmeds-admin-over-arsi-massacre/#Ethiopia#OLA#Arsi

Borkena

@borkena · Post #5902 · 01.03.2026 г., 21:09

የኢትዮጵያ እስልምና ጉዳዮች ጠቅላይ ም/ቤት በአርሲ ዞን የተፈፀመውን ግድያ አወገዘ። ምክር ቤቱ " በኦሮሚያ ክልል አርሲ ዞን ሺርካ ወረዳ በንፁሐን የኦርቶዶክስ ክርስትና ሀይማኖት ተከታዮች ወገኖቻችን ላይ በደረሰው አሰቃቂ አደጋ በእጅጉ አዝነናል " ሲል አስታውቋል። መግለጫው አክሎም "ድርጊቱ የትኛውንም ሃይማኖት አይወክልም " ያለ ሲሆን " ይልቁኑም በሃይማኖቶች መካከል ለዘመናት ያለውን የመከባበር እሴት በመናድ በአማኞች ህዝቦች መካከል ጥርጣሬና ግጭት ለመፍጠር የተቀነባበረ እኩይ ሴራ ነው ብለን እናምናለን " ብሏል። መንግስት አጥፊዎቹን በመለየት አፋጣኝ እርምጃ እንዲወስድ ምክር ቤቱ ጠይቆ " ለሟች ቤተሰቦች አላህ መፅናናቱን እንዲሰጥ እንለምነዋለን " በማለት ገልጿል። #Ethiopia#Oromia#Arsi#news#ዜና

Borkena

@borkena · Post #5865 · 26.02.2026 г., 13:33

በምሥራቅ አርሲ ሦስት ኦርቶዶክሳውያን በታጣቂዎች ተገደሉ ። ከወራት በፊት ተመሳሳይ ጥቃት በተፈፀመበት በዚህ ዞን ዘላቂ መፍትሔ አለመፈለጉ ስጋት እንደፈጠረባቸው የአካባቢው ነዋሪዎች መናገራቸውን የኢትዮጵያ ኦርቶዶክስ ተዋሕዶ ቴሌቪዥን ዘግቧል። በምሥራቅ አርሲ ሀገረ ስብከት መርቲ አቦምሳ ወረዳ ፈረቀሳ ቀበሌ ሶስት ኦርቶዶክሳውያን እና አንድ ሙስሊም በታጣቂዎች ጥቃት ሕይወታቸው ማለፉ ተገልጿል። እያሰለሰ በቀጠለው የምሥራቅ አርሲ ሀገረ ስብከት ችግር ዛሬም በሦስት ኦርቶዶክሳውያን እና በ1 ሙስሊም ወገኖቻችን ላይ ሕልፈተ ሕይወት ማድረሱን የአሥር ኦርቶዶክሳውያን ከብቶች፣ ጎተራዎች እና ቤት ንብረቶች በእሳት በመቃጠሉ የተሰማቸውን ጥልቅ ሐዘን ብፁዕ አቡነ ኤልሣዕ የሶማሌ እና የምሥራቅ አርሲ ሀገረ ስብከት ጳጳስ ገልጸዋል። ብፁዕነታቸው መንግሥት ሕገ ወጥ ታጣቂዎችን በማጥፋት የኦርቶዶክሳውያንን ደህንነት የመጠበቅ እና ሰላምን የማስፈን ተግባሩን እንዲያከናውንም ጠይቀዋል። #Ethiopia#Oromia#Arsi#Ethiopiannews#ዜና

የአሰላ የንፋስ ኃይል ማመንጫ፣ ግብርናን ለማዘመን እና የገበያ ትስስር ለመፍጠር ያለው ፋይዳ የጎላ ነው - ጠቅላይ ሚኒስትር ዐቢይ አሕመድ (ዶ/ር) ********************* ጠቅላይ ሚኒስትር ዐቢይ አሕመድ (ዶ/ር) በአሰላ የንፋስ ኃይል ማመንጫ ጣቢያ ምርቃት ላይ ባደረጉት ንግግር፣ የልማት ዝርጋታና የኢነርጂ አማራጮች ለአካባቢው አርሶ አደሮች የኑሮ ጥራት መሻሻልና ለኢኮኖሚ ዕድገት ያላቸውን ፋይዳ አብራርተዋል። ጠቅላይ ሚኒስትር ዐቢይ ለአሰላ፣ ለአርሲ እና ለአጎራባች የምስራቅ ሸዋ ነዋሪዎች ባስተላለፉት መልዕክት፣ አርሲ በእርሻ ምርታማነቱ ቢታወቅም፣ የነበረበት የውስጥ ለውስጥ መንገድ እጥረት ትልቅ ፈተና መሆኑን አንስተዋል። አዲሱ የንፋስ ኃይል ማመንጫ ጣቢያ የገነባው ከ27 ኪሎ ሜትር በላይ መንገድ ለንፋስ ኃይል ማመንጫው ግልጋሎት ከመስጠት ባሻገር ለአካባቢው ግብርና መዘመን መሠረት የሚጥል መሆኑን ገልጸዋል። መንገዱ ከኮምባይነሮችና ትራክተሮች በተጨማሪ ትራንስፖርትን ተደራሽ በማድረግ ምርትን በፍጥነት ወደ ማዕከላዊ ገበያ ለማድረስ ያግዛል ብለዋል። የአርሶ አደሩ ምርት እንዳለ ለገበያ ከመቅረብ ይልቅ በቅርብ ርቀት በሚገኙ አግሮ-ፕሮሰሲንግ ኢንዱስትሪዎች ገብቶ፣ ተቀናብሮ፣ እሴት ተጨምሮበት እንዲወጣ በማድረግ የተሻለ ገቢ ለማስገኘት እንደሚሠራ ገልጸዋል። በየአካባቢው በመንግሥት የተጀመሩ በርካታ ፕሮጀክቶች ከፍተኛ ክትትል እየተደረገላቸው በመጠናቀቅ ላይ እንደሚገኙ አውስተው፤ ለኢትዮጵያ ብልጽግና መሠረት የመጣሉ ሥራ ተጠናክሮ ይቀጥላል ብለዋል። በንፍታሌም እንግዳወርቅ #Ethiopia#Arsi#AsellaWindFarm#EthiopiaDelivers#AbiyAhmed#EBC

Borkena

@borkena · Post #5920 · 04.03.2026 г., 08:27

የአማራ ፋኖ ብሔራዊ ንቅናቄ (አፋብን) በምስራቅ አርሲ ሀገረ ስብከት ስር በሚገኙ ወረዳወች ነዋሪ የሆኑ የቤተ ክህነቷ ታላላቅ አባቶች፣ ካህናት እና ምዕመናን ላይ በደረሰባቸው ጭፍጨፋ ከፍተኛ ሀዘን የተሰማው መሆኑን ገለፀ። ሙሉ መግለጫው ከላይ ተያይዟል። #Ethiopia#Oromia#Arsi#AFNM#Ethiopiannews#news#ዜና

12
ПретходнаСтраница 1 од 2Следна