Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
😱 Kiberpankka oz qoldi...
🫀 Haqiqiy yurak transplantatsiyasi uchun navbatlar juda uzun, shu sababli olimlar sun’iy yuraklarni faol ishlab chiqmoqda. Tez orada real hayotdagi sinovlar ham boshlanarmish.
➡️#tibbiyot | Birinchi raqamli IT-Blog
Prezident Shavkat Mirziyoyev Raqamli sog‘liqni saqlash markazi va Respublika ixtisoslashtirilgan kardiologiya ilmiy-amaliy tibbiyot markazining Samarqand filiallari faoliyati bilan tanishdi. Shu bilan davlatimiz rahbarining Samarqand viloyatiga tashrifi yakunlandi, Prezidentimiz Toshkentga qaytib keldi.
—
Президент Шавкат Мирзиёев ознакомился с деятельностью самаркандских филиалов Центра цифрового здравоохранения и Республиканского специализированного научно-практического медицинского центра кардиологии. На этом поездка главы государства в Самаркандскую область завершилась, Президент нашей страны вернулся в Ташкент.
#Mirziyoyev#safar#Samarqand#tibbiyot
Prezident.uz|Facebook|Instagram|YouTube|X
Yevropa Ittifoqining birinchi raqamli oliygohi — Myunxen texnika universiteti bilan tarixiy hamkorlik!
⚡️ “Yangi O’zbekiston” universiteti dunyoning TOP-22, Yevropaning eng ilg’or universiteti — Myunxen texnika universiteti (TUM) bilan strategik hamkorlikni kengaytirmoqda!
✨TUM Prezidenti Prof. Tomas Xofmann, klinika bosh direktori Martin Ziess va tibbiyot maktabi dekani Prof. Stefani Kombs bilan uchrashuvlar o'tkazildi.
✅ Uchrashuv natijalariga ko'ra quyidagilarga kelishib olindi:
🧪 “Yangi O’zbekiston” universitetida Tibbiyot maktabi Myunxen Texnika universiteti bilan hamkorlilda tashkil etiladi
🌍Talabalar almashinuvi dasturlari yo‘lga qo‘yiladi
🔬Biomuhandislik va tibbiy muhandislikda ilg‘or ilmiy hamkorlik rejalashtirilmoqda
🎗 Bu hamkorlik — sog‘liqni saqlash va ta’lim sohasida global maydonga qo'yilayotgan qadamni ko'rsatib beradi.
🔁English
➖➖➖➖➖➖➖➖➖➖➖➖➖
#TUM#hamkorlik#tibbiyot
⬇️ Biz ijtimoiy tarmoqlarda:
Veb-sayt | Telegram | Instagram | Facebook
Президент Шавкат Мирзиёев Қарши шаҳрида қурилган Республика ихтисослаштирилган Она ва бола саломатлиги илмий-амалий тиббиёт марказининг ҳудудий филиалига ташриф буюрди.
—
Президент Шавкат Мирзиёев посетил построенный в городе Карши региональный филиал Республиканского специализированного научно-практического медицинского центра здоровья матери и ребенка.
#Mirziyoyev#safar#Qashqadaryo#tibbiyot
Prezident.uz|Facebook|Instagram|YouTube|Twitter
Prezident Shavkat Mirziyoyev yangidan barpo etilgan Jizzax viloyati koʻp tarmoqli tibbiyot markaziga tashrif buyurdi.
—
Президент Шавкат Мирзиёев посетил вновь построенный многопрофильный медицинский центр Джизакской области.
#Mirziyoyev#safar#Jizzax#tibbiyot
Prezident.uz|Facebook|Instagram|YouTube|X
🗿Prezident Shavkat Mirziyoyev yangidan barpo etilgan Jizzax viloyati koʻp tarmoqli tibbiyot markaziga tashrif buyurdi.
#Mirziyoyev#safar#Jizzax#tibbiyot
🌐 Bizni ijtimoiy tarmoqlarda kuzating!
✈️@JTV_rasmiy
✈️@JTV_Reklama
Prezident Shavkat Mirziyoyev sogʻliqni saqlash tizimini yanada rivojlantirish, tibbiy xizmatlar sifatini oshirish va xususiy sektor ishtirokini kengaytirish chora-tadbirlari yuzasidan taqdimot bilan tanishdi.
—
Президент Шавкат Мирзиёев ознакомился с презентацией по мерам дальнейшего развития системы здравоохранения, повышения качества медицинских услуг и расширения участия частного сектора.
#Mirziyoyev#taqdimot#tibbiyot#xususiysektor
Prezident.uz|Facebook|Instagram|YouTube|X
Prezident Shavkat Mirziyoyev Raqamli sog‘liqni saqlash markazi va Respublika ixtisoslashtirilgan kardiologiya ilmiy-amaliy tibbiyot markazining Samarqand filiallari faoliyati bilan tanishdi. Shu bilan davlatimiz rahbarining Samarqand viloyatiga tashrifi yakunlandi, Prezidentimiz Toshkentga qaytib keldi.
—
Президент Шавкат Мирзиёев ознакомился с деятельностью самаркандских филиалов Центра цифрового здравоохранения и Республиканского специализированного научно-практического медицинского центра кардиологии. На этом поездка главы государства в Самаркандскую область завершилась, Президент нашей страны вернулся в Ташкент.
#Mirziyoyev#safar#Samarqand#tibbiyot
Prezident.uz|Facebook|Instagram|YouTube|X
Президент Шавкат Мирзиёев Тошкент шаҳридаги “M-Clinic” кўп тармоқли тиббиёт марказини бориб кўрди.
—
Президент Шавкат Мирзиёев ознакомился с многопрофильным медицинским центром “M-Clinic” в городе Ташкенте.
#Mirziyoyev#tanishuv#tibbiyot#klinika
Prezident.uz|Facebook|Instagram|YouTube|Twitter
Prezident Shavkat Mirziyoyev Raqamli sog‘liqni saqlash markazi va Respublika ixtisoslashtirilgan kardiologiya ilmiy-amaliy tibbiyot markazining Samarqand filiallari faoliyati bilan tanishdi. Shu bilan davlatimiz rahbarining Samarqand viloyatiga tashrifi yakunlandi, Prezidentimiz Toshkentga qaytib keldi.
—
Президент Шавкат Мирзиёев ознакомился с деятельностью самаркандских филиалов Центра цифрового здравоохранения и Республиканского специализированного научно-практического медицинского центра кардиологии. На этом поездка главы государства в Самаркандскую область завершилась, Президент нашей страны вернулся в Ташкент.
#Mirziyoyev#safar#Samarqand#tibbiyot
Prezident.uz|Facebook|Instagram|YouTube|X
Президент Шавкат Мирзиёев фтизиатрия ва пульмонология соҳасини ривожлантириш, ОИТС касаллигининг олдини олиш масалалари бўйича йиғилиш ўтказди.
—
Президент Шавкат Мирзиёев провел совещание по вопросам развития фтизиатрии и пульмонологии, профилактики СПИДа.
#Mirziyoyev#yigilish#tibbiyot#profilaktika
Prezident.uz|Facebook|Instagram|YouTube|Twitter