Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Iqtisodiyot va biznes sohasi vakillari uchun ochiq ma'ruza
💥 Global reytingda 26-o'rinda turuvchi Germaniyaning Myunxen texnika universiteti professori Dr. Paul Momtaz iqtisodiyot va biznes sohalariga qiziquvchilarni ochiq ma'ruzaga taklif qildi.
👉Ro‘yxatdan o‘tish
📅 Sana: 15-mart, 16:00
📍 Manzil: “Yangi O‘zbekiston” universiteti
✅ Ma'ruzada talabalar, biznes sohasi vakillari, iqtisodiyot sohasida ishlovchilar va barcha qiziquvchilar qatnashishlari mumkin.
🔁English
➖➖➖➖➖➖➖➖➖➖➖
#TUM#lecture
⬇️Biz ijtimoiy tarmoqlarda:
Veb-sayt | Instagram | Telegram
Dunyoga mashhur professorning ma'ruzasiga taklif qilamiz
💥Top 26-o'rinda turuvchi Germaniyaning Myunxen texnika universiteti professori Dr. Paul Momtaz tomonidan "Xususiy kapital investorlarining barqarorlik amaliyotlari" mavzusida ma'ruza tashkil etiladi.
⚡️ Dr. Paul Momtaz moliya va investitsiyalar sohasida dunyoga mashhur mutaxassis bo‘lib, barqaror biznes va investitsiyalar bo‘yicha ko‘plab ilmiy tadqiqotlar muallifidir.
👉Ro‘yxatdan o‘tish
📅 Ma’ruza vaqti: 15-mart, 16:00
📍 Manzil: “Yangi O‘zbekiston” universiteti, U.C.A bino 2-qavati)
🔹 Kimlar uchun: Universitet talabalari, professor-o‘qituvchilar va iqtisodiyotga qiziquvchilar.
Imkoniyatni qo‘ldan boy bermang! Barqaror investitsiyalar haqida dunyo darajasidagi mutaxassisdan bilim olib, o'z tajribangizni yanada oshiring.
🔁English
➖➖➖➖➖➖➖➖➖➖➖➖➖
#TUM#lecture
⬇️ Biz ijtimoiy tarmoqlarda:
Veb-sayt | Telegram | Instagram | Facebook
Neytrino sirlari va atom yadrolari bo'yicha ma'ruzagataklif qilamiz
✅ “Yangi O‘zbekiston” universitetida 26-mart kuni soat 13:00 da astrofizik olim, professor Toshitaka Kajino tomonidan ma'ruza tashkil etiladi.
✨ Professor Toshitaka Kajino – taniqli kosmolog va yadro astrofizigi. U neytrinolar, katta portlash (Big Bang) va atom yadrolarining paydo bo‘lishini tadqiq qilgan. So‘nggi tadqiqotlarida u og‘ir atom yadrolari asosan supernovalar va kollapsarlar natijasida hosil bo‘lishini aniqlagan.
👉 Ro'yxatdan o'tish: https://forms.gle/kna4PYD9fk35wPeT7
📍 Manzil: “Yangi O‘zbekiston” universiteti, U.C.A bino 2-qavati)
🎗 Barcha qiziquvchilarni ma'ruzada kutib qolamiz!
🔁English
➖➖➖➖➖➖➖➖➖➖➖➖➖
#astrofizika#lecture
⬇️ Biz ijtimoiy tarmoqlarda:
Veb-sayt | Telegram | Instagram | Facebook
(нова лекція)
Лекция 4. Мехико - Ташкент: Культурная революция в искусстве Латинской Америки и Центральной Азии
#ru#history#lecture
Хлопковые и картофельные поля, масштабная индустриализация и массовая урбанизация. Традиционная визуальная культура и революционный пафос. Поиск монументальной формы, движение от холста к стене. Фреска как модель для нового революционного искусства. Это темы, с которыми работали художники Латинской Америки, в первую очередь мексиканские, и их товарищи в Центральной Азии. Мексиканский художник-коммунист Диего Ривера в 1930-е становится одной из самых авторитетных фигур в международном пролетарском искусстве, особенно после посещения СССР в конце 1920-х. В четвертой лекции мы подробно рассмотрим, как латиноамериканские и центральноазиатские художники приходили к очень схожим визуальным решениям в отображении постреволюционных преобразований в 1930-е в первую очередь на примере «Бригады Волкова» в Узбекистане, а также влияние мексиканского мурализма на художников-«шестидесятников» в Казахстане и Таджикистане во второй половине ХХ века
Серия лекций "Искусство Центральной Азии в глобальном контексте" Георгия Мамедова
#ru#lecture#history
Серия лекций предлагает экскурс в историю центральноазиатского искусства ХХ и ХХI веков сквозь призму неожиданных пересечений между художественными контекстами, которые на первый взгляд никак между собой не связаны. Что общего между ранним советским искусством Кыргызстана и левым искусством того же периода в США? Как связаны мексиканский мурализм и центральноазиатская живопись 20 века? Что из себя представляло современное искусство 1990-х и начала 2000-х? Все эти, и многие другие вопросы будут подробно рассмотрены в курсе из девяти лекций, который будет интересен как аудитории, которая только знакомится с искусством региона, так и специалистам – художникам и искусствоведам, - которые бы хотели расширить свои знания и представления о современном искусстве Центральной Азии.
Лекция 1. Провинциальный взгляд на Европейское искусство от Ренессанса до Авангарда
История искусства, как и любая другая история, - в первую очередь, рассказ, сторителлинг. Как и в любом рассказе, у истории искусства есть свои главные и второстепенные сюжетные линии и персонажи. Центральноазиатское искусство – как раз одно из таких второстепенных ответвлений основного сюжета мировой истории искусства. Но только в том рассказе, к которому мы все привыкли, и, если честно, который нам всем наскучил. Данный курс – это своего рода спин-офф привычной истории искусства, в котором второстепенные персонажи выходят на авансцену, оказываются в центре повествования, в то время как главные герои занимают роль массовки. Но насколько такой радикальный сюжетный поворот оправдан? Именно на этот вопрос отвечает первая лекция курса, в которой предлагаются методологические основания для иного, не европоцентричного рассказа об искусстве ХХ и ХХI веков, вдохновленного постколониальной теорией истории, а именно, - работой Дипеша Чакрабарти «Провициализируя Европу».
Лекция 2. Ковры – Самолеты. Традиционное искусство Центральной Азии и ранний советский авангард
Ковры – Самолеты. Традиционное искусство Центральной Азии и ранний советский авангард
Искусство Центральной Азии 1920-30-х годов часто описывается искусствоведческими формулами вроде «поиск синтеза Востока и Запада» или «встреча традиции и современности». Продолжая критическую ревизию устоявшихся нарративов об искусстве, начатую на первой лекции, мы попытаемся посмотреть на раннее советское искусство Центральной Азии не как встречу абстрактных «Востока» и «Запада», «Традиции» и «Современности», а как на результат критической и творческой работы отдельных художников и художниц, вырабатывавших самостоятельные художественные и жизненные стратегии в контексте бушующих исторических событий. В лекции будут подробно рассмотрены работы Бяшима Нурали (Туркменистан) и узбекских художников Шамсрой Хасановой и Урала Тансыкбаева.
Oliy maktabda “Loyiha boshqaruvi: asosiy daraja” maxsus malaka oshirish kursi tashkil etildi
🔎Batafsil
🇬🇧Eng
🇷🇺Ru
☎️ +998 71-239-03-10
🌐https://rgsbm.uz
#GraduateSchool#Project#Management#Lecture
Web-site | Telegram | Facebook | Instagram