Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Konditsionerni yozgi mavsumga tayyorlaymiz.
1 Havo filtrlarini changdan tozalash lozim.
2 Servis markazdan mutaxassislarni chaqiring.
3 Mutaxassis tashqi blok ventilyatsiyasini tozalaydi va lozim bo'lsa, freonga yonilg'i quyib to'ldiradi.
_________________
Готовим кондиционер к летнему сезону.
1 Необходимо очистить воздушные фильтры от пыли.
2 Вызвать мастеров с сервисного центра.
3 Мастер очистит вентилятор наружного блока и при необходимости проведет дозаправку фреона.
#Artel#IshonchlivaBarakali#Inverter#Konditsioner
Wi-fi funksiyasini qanday ulash mumkin?
1 Pultidagi "Health" tugmasini 8 marta bosing
2 Undan so’ng smartfoningizga maxsus AC Smart (Ac Freedom) dasturini yuklab oling.
3 Konditsionerni Add device yordamida dasturga ulang.
4 Wi-Fi routeringizning login va parolini kiriting.
__________________
Для активации модуля Wi-fi кондиционера
1 нажмите на пульте кнопку «Health» 8 раз.
2 Затем, скачайте специальное приложение AC Smart (Ac Freedom) на смартфон.
3 Подключите кондиционер к приложению с помощью Add device.
4 Введите логин и пароль от Вашего Wi-fi роутера.
#Artel#IshonchlivaBarakali#Inverter#Konditsioner
⚒O'z-o'zini diagnostika qilish va tozalash funksiyasi.
I Clean funksiyasi konditsionerni mustaqil ravishda tozalaydi va konditsionerga xizmat ko'rsatish kerak bo'lsa, diagnostika funksiyasini taklif qiladi.
___________________
⚒Функции самоочистки и самодиагностики.
Функция I Clean самостоятельно очищает кондиционер, а функция самодиагностики подсказывает если кондиционеру требуется сервисная служба.
#Artel#IshonchlivaBarakali#Inverter#Konditsioner
Xatolar yuzaga kelsa, xizmat ko'rsatish markaziga qo'ng'iroq qiling +998 78 148 88 88.
_________________
В случае появления ошибок позвоните в сервисную службу по номеру +998 78 148 88 88.
#Artel#IshonchlivaBarakali#Inverter#Konditsioner
Inverter konditsioneridagi WI-FI funksiyasi konditsionerni masofadan boshqarish imkonini beradi. Maxsus AC Smart dasturidan foydalanib, harorat rejimini masofadan sozlashingiz mumkin.
_________________
Функция WI-FI в инверторном кондиционере позволит Вам управлять кондиционером дистанционно. Используя специальное приложение AC Smart, можно дистанционно настроить температурный режим Вашего кондиционера.
#Artel#IshonchlivaBarakali#Inverter#Konditsioner
Chilla boshlanishini kutmang. Bugunoq konditsioner sotib oling!
_________
Не ждите когда настанет жар. Покупайте кондиционер уже сегодня!
#Artel#IshonchlivaBarakali#Inverter#Konditsioner
Havoni ionlash
Ionizatsiyasi tufayli havoda aylanib yuradigan chang zich qatlamga aylanadi va yuzalarga joylashadi. Artel konditsionerlari bilan nafas olish juda oson va yoqimli bo'ladi.
__________
Ионизация воздуха
Благодаря ионизации воздуха, пыль, которая витает в воздухе начинает сбиваться в более плотные комки и оседает на пол. С кондиционером Artel дышать становится гораздо легче и приятней.
#Artel#IshonchlivaBarakali#Inverter#Konditsioner
Inverter motorining afzalliklari:
1. 41% energiya tejamkorligi.
2. Past shovqin darajasi.
3. Barqaror belgilangan harorat.
4. Chidamlilik.
________________
Благодаря инверторной технологии, достигая заданной температуры внутри помещения кондиционер не отключается, а переходит на пониженную мощность и очень точно поддерживает заданную температуру.
Преимущества инверторного мотора:
1. Экономия электроэнергии на 41%.
2. Низкий шума.
3. Отсутствие больших перепадов температур.
4. Долговечность.
#Artel#IshonchlivaBarakali#Inverter#Konditsioner
Konditsionerning Turbo Cool funksiyasi xonani tezroq sovutish uchun qurilmaning maksimal quvvatini faollashtiradi.
___________________
Функция Turbo Cool активирует максимальную мощность кондиционера для скорейшего охлаждения помещения.
#Artel#IshonchlivaBarakali#Inverter#Konditsioner
Artel konditsionerida Volt Control elektr kuchlanish nazorati tizimi mavjud, ya'ni u elektr energiyasining 400V gacha keskin o'zgarishlaridan himoyalangan!
_______________________________
В кондиционере Artel предусмотрена защита от перепадов напряжения. При резком скачке напряжения до 400 В кондиционер продолжает работать в штатном режиме без перебоев и отключений.
#Artel#IshonchlivaBarakali#Inverter#Konditsioner
Artel Everest Inverter konditsionerining afzalliklaridan biri 130 V past elektr kuchlanishida sovutish hamda isitishning mo'tadilligidir.
________________
Одним из преимуществ кондиционера Artel Everest является работа при низком напряжении в электросети от 130В.
#IshonchlivaBarakali#Artel#Inverter#Konditsioner
Inverter texnologiyasi kundalik elektr energiyasini sarfini tejash imkonini beradi. Inverter kompressori oddiy kompressordan farqli o'laroq, elektr energiyasini 41% gacha tejaydi.
________________________
Технология цифрового инвертора обеспечивает ежедневную экономию. В отличии от обычного компрессора инверторный снижает расход электроэнергии на 41 %.
#Artel#ИнверторныйКомпрессор#Экономия#Inverter